facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 288
  •  
ちょっと笑った

ここまで見た
  • 289
  •  
紺屋の白袴

ここまで見た
  • 290
  •  
違うか、医者の不養生かな

ここまで見た
  • 291
  •  
おまわりさんが痴漢

ここまで見た
  • 292
  •  
そうか、そっちか

ここまで見た
  • 293
  •  
  • 2013/09/01(日) 02:40:49.67
さて

ここまで見た
  • 294
  • 2013/09/01(日) 13:43:28.79
9月になりましたが

ここまで見た
  • 295
  •  
  • 2013/09/01(日) 13:50:07.64
2ちゃん落ちるのって今日だっけ?

ここまで見た
  • 296
  •  
  • 2013/09/01(日) 15:40:01.66
うそなんでしょう?

ここまで見た
  • 297
  •  
  • 2013/09/01(日) 17:59:04.17
よく見ろ 3ちゃんねるに変わってるだろ

ここまで見た
  • 298
  •  
  • 2013/09/01(日) 18:34:41.38
 _, ._
(; ゚ _゚ ) …

ここまで見た
  • 299
  •  
  • 2013/09/02(月) 03:09:55.31
>>297
めったなことを言うんじゃありません。
頑張って見る>>298のような素直な人もいるんだから。
って、勝手に文字コードの数字がズレたら嫌だな。
通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。

ここまで見た
  • 300
  •  
  • 2013/09/08(日) 21:02:59.58
>通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
EBCDICディスってるのか

ここまで見た
  • 301
  •  
  • 2013/09/08(日) 21:31:07.18
ディスられて当然のゴミコードがどうかした?

ここまで見た
  • 302
  •  
  • 2013/09/09(月) 00:08:59.56
UNICODEも添字系が無茶苦茶

ここまで見た
  • 303
  •  
  • 2013/09/09(月) 11:58:12.44
添字系?

ここまで見た
  • 304
  •  
  • 2013/09/09(月) 18:23:36.13
字は添えるだけ。

ここまで見た
  • 305
  •  
  • 2013/09/09(月) 20:26:20.42
Superscripts and Subscripts

ここまで見た
  • 306
  •  
  • 2013/09/09(月) 21:20:07.96
http://www.unicode.org/charts/PDF/U2070.pdf
これか。なるほどこれひどい

ここまで見た
  • 307
  •  
  • 2013/09/10(火) 18:37:08.00
小さすぎて読めない

ここまで見た
  • 308
  •  
  • 2013/09/10(火) 20:39:14.29
なんでiが1の位置にあるんだろう?

「数字の1を意味する上付き文字」を全部統合するつもりだった?

ここまで見た
  • 309
  •  
  • 2013/09/10(火) 21:22:03.40
SuperScript 1〜3は別の場所にある。
2: U+00B2
3: U+00B3
1: U+00B9

ここまで見た
  • 310
  •  
  • 2013/09/10(火) 21:25:05.86
oh....

ここまで見た
  • 311
  •  
  • 2013/09/11(水) 04:58:45.13
>>307ちゃんとダウンロードして拡大して見ろ>私 ゴメン

ここまで見た
  • 312
  •  
  • 2013/09/11(水) 09:54:06.83
まあ、前後とか上中下とか甲乙丙丁とかI II III IV V VI VII VIII IX Xとか、
特定の用法においてナンバリングに使われる文字も位置はばらばらで、
こういうのを名前に含むファイルをソートするとうわあああってなるから
実用上は似たようなもんかもしれん

ここまで見た
  • 313
  •  
  • 2013/09/11(水) 10:22:47.43
確かに前後はいつも逆になって鬱陶しい

ここまで見た
  • 314
  •  
  • 2013/09/12(木) 22:36:56.49
一九五三四七十二八六

結構イラッとくる

ここまで見た
  • 315
  •  
  • 2013/09/12(木) 22:54:00.51
WikipediaのCollationのページに対応する日本語ページってないんだね

ここまで見た
  • 316
  •  
  • 2013/09/13(金) 04:14:55.98
欲しければ作れば?

ここまで見た
  • 317
  •  
  • 2013/09/16(月) 07:42:40.82
>>314
これぐらいは順番に並べて欲しいわなあ

ここまで見た
  • 318
  •  
  • 2013/09/16(月) 11:45:02.26
>>314 >>317
だれが決めたん?
センスないね

ここまで見た
  • 319
  •  
  • 2013/09/16(月) 12:18:33.64
あほかい。
漢字の読みの順に並んでいるんだから、寧ろ「一二三四五六七八九」の方がいらっと来るわ。

ここまで見た
  • 320
  •  
  • 2013/09/16(月) 12:23:33.36
えぇっ!?

ここまで見た
  • 321
  •  
  • 2013/09/16(月) 13:04:28.81
>>319
確かに

ここまで見た
  • 322
  •  
  • 2013/09/16(月) 13:29:36.80
読み順で並んでるメリットって何?

ここまで見た
  • 323
  •  
  • 2013/09/16(月) 13:46:41.82
読み順以外を選ぶメリットって何?

ここまで見た
  • 324
  •  
  • 2013/09/16(月) 14:16:25.26
読み順というか文字コード順でソートしているからこうなるので、
漢数字がいい感じで並ぶ順を定義して実装して使えばいい

ここまで見た
  • 325
  •  
  • 2013/09/17(火) 01:24:13.67
メリットって…
他のところが音読み順なのにそこだけ変えるほうがおかしいだろ
というか>>314 >>317 >>322あたりはもしかしてこの十文字が連続して並んでるとか思ってるんじゃないだろうな

ここまで見た
  • 326
  •  
  • 2013/09/17(火) 02:23:12.95
CJK Numeralsとかの別枠にしてほしかったってことでしょ

ここまで見た
  • 327
  •  
  • 2013/09/17(火) 02:32:41.19
訓呉音漢音の優先順位あやふやにローマ字で並べてある
ような始末におえん状況よりはマシでしょ

ここまで見た
  • 328
  •  
  • 2013/09/17(火) 02:38:15.05
Unicodeの漢字って日本読み順なの?

ここまで見た
  • 329
  •  
  • 2013/09/17(火) 03:24:48.54
読み順を選べば読み順、画数順を選べば画数順、なんじゃないの?

ここまで見た
  • 330
  •  
  • 2013/09/17(火) 03:57:19.63
(´‥∀‥`)?

ここまで見た
  • 331
  •  
  • 2013/09/17(火) 05:26:00.76
>>329は見なかったことにしといて

ここまで見た
  • 332
  •  
  • 2013/09/17(火) 14:11:11.79
(´・‥∀・‥`)?

ここまで見た
  • 333
  •  
  • 2013/09/17(火) 17:35:55.62
>>314 はJIS順なのかな
Unicode順なら 一七三九二五八六十四

ここまで見た
  • 334
  •  
  • 2013/09/17(火) 18:49:54.69
漢数字を文字コードだけで機械的にソートするとか、どんだけ

ここまで見た
  • 335
  •  
  • 2013/09/17(火) 19:46:20.12
0100
0100
〇一〇〇
零百
十〇
〇壱〇〇
最適解が欧文の比じゃない数有るからなあ

ここまで見た
  • 336
  •  
  • 2013/09/17(火) 20:49:55.10
そういうのはフリガナとかヨミガナとかのソートの種を入れますし。

ここまで見た
  • 337
  •  
  • 2013/09/17(火) 21:07:54.19
1024*1024のビットマップフォントにして
黒の数でソートしようず

ここまで見た
  • 338
  •  
  • 2013/09/17(火) 21:56:58.21
それが黒だと誰が決めた

ここまで見た
  • 339
  •  
  • 2013/09/17(火) 22:02:47.20
黄色でもいいけどよ
モノクロ二値にすんだよハゲっが

フリックラーニング
フリック回転寿司
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード