facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 300
  •  
  • 2013/09/08(日) 21:02:59.58
>通常の頭では連続していると考える文字(群)のコードが飛び飛びなのもヤだね。
EBCDICディスってるのか

ここまで見た
  • 301
  •  
  • 2013/09/08(日) 21:31:07.18
ディスられて当然のゴミコードがどうかした?

ここまで見た
  • 302
  •  
  • 2013/09/09(月) 00:08:59.56
UNICODEも添字系が無茶苦茶

ここまで見た
  • 303
  •  
  • 2013/09/09(月) 11:58:12.44
添字系?

ここまで見た
  • 304
  •  
  • 2013/09/09(月) 18:23:36.13
字は添えるだけ。

ここまで見た
  • 305
  •  
  • 2013/09/09(月) 20:26:20.42
Superscripts and Subscripts

ここまで見た
  • 306
  •  
  • 2013/09/09(月) 21:20:07.96
http://www.unicode.org/charts/PDF/U2070.pdf
これか。なるほどこれひどい

ここまで見た
  • 307
  •  
  • 2013/09/10(火) 18:37:08.00
小さすぎて読めない

ここまで見た
  • 308
  •  
  • 2013/09/10(火) 20:39:14.29
なんでiが1の位置にあるんだろう?

「数字の1を意味する上付き文字」を全部統合するつもりだった?

ここまで見た
  • 309
  •  
  • 2013/09/10(火) 21:22:03.40
SuperScript 1〜3は別の場所にある。
2: U+00B2
3: U+00B3
1: U+00B9

ここまで見た
  • 310
  •  
  • 2013/09/10(火) 21:25:05.86
oh....

ここまで見た
  • 311
  •  
  • 2013/09/11(水) 04:58:45.13
>>307ちゃんとダウンロードして拡大して見ろ>私 ゴメン

ここまで見た
  • 312
  •  
  • 2013/09/11(水) 09:54:06.83
まあ、前後とか上中下とか甲乙丙丁とかI II III IV V VI VII VIII IX Xとか、
特定の用法においてナンバリングに使われる文字も位置はばらばらで、
こういうのを名前に含むファイルをソートするとうわあああってなるから
実用上は似たようなもんかもしれん

ここまで見た
  • 313
  •  
  • 2013/09/11(水) 10:22:47.43
確かに前後はいつも逆になって鬱陶しい

ここまで見た
  • 314
  •  
  • 2013/09/12(木) 22:36:56.49
一九五三四七十二八六

結構イラッとくる

ここまで見た
  • 315
  •  
  • 2013/09/12(木) 22:54:00.51
WikipediaのCollationのページに対応する日本語ページってないんだね

ここまで見た
  • 316
  •  
  • 2013/09/13(金) 04:14:55.98
欲しければ作れば?

ここまで見た
  • 317
  •  
  • 2013/09/16(月) 07:42:40.82
>>314
これぐらいは順番に並べて欲しいわなあ

ここまで見た
  • 318
  •  
  • 2013/09/16(月) 11:45:02.26
>>314 >>317
だれが決めたん?
センスないね

ここまで見た
  • 319
  •  
  • 2013/09/16(月) 12:18:33.64
あほかい。
漢字の読みの順に並んでいるんだから、寧ろ「一二三四五六七八九」の方がいらっと来るわ。

ここまで見た
  • 320
  •  
  • 2013/09/16(月) 12:23:33.36
えぇっ!?

ここまで見た
  • 321
  •  
  • 2013/09/16(月) 13:04:28.81
>>319
確かに

ここまで見た
  • 322
  •  
  • 2013/09/16(月) 13:29:36.80
読み順で並んでるメリットって何?

ここまで見た
  • 323
  •  
  • 2013/09/16(月) 13:46:41.82
読み順以外を選ぶメリットって何?

ここまで見た
  • 324
  •  
  • 2013/09/16(月) 14:16:25.26
読み順というか文字コード順でソートしているからこうなるので、
漢数字がいい感じで並ぶ順を定義して実装して使えばいい

ここまで見た
  • 325
  •  
  • 2013/09/17(火) 01:24:13.67
メリットって…
他のところが音読み順なのにそこだけ変えるほうがおかしいだろ
というか>>314 >>317 >>322あたりはもしかしてこの十文字が連続して並んでるとか思ってるんじゃないだろうな

ここまで見た
  • 326
  •  
  • 2013/09/17(火) 02:23:12.95
CJK Numeralsとかの別枠にしてほしかったってことでしょ

ここまで見た
  • 327
  •  
  • 2013/09/17(火) 02:32:41.19
訓呉音漢音の優先順位あやふやにローマ字で並べてある
ような始末におえん状況よりはマシでしょ

ここまで見た
  • 328
  •  
  • 2013/09/17(火) 02:38:15.05
Unicodeの漢字って日本読み順なの?

ここまで見た
  • 329
  •  
  • 2013/09/17(火) 03:24:48.54
読み順を選べば読み順、画数順を選べば画数順、なんじゃないの?

ここまで見た
  • 330
  •  
  • 2013/09/17(火) 03:57:19.63
(´‥∀‥`)?

ここまで見た
  • 331
  •  
  • 2013/09/17(火) 05:26:00.76
>>329は見なかったことにしといて

ここまで見た
  • 332
  •  
  • 2013/09/17(火) 14:11:11.79
(´・‥∀・‥`)?

ここまで見た
  • 333
  •  
  • 2013/09/17(火) 17:35:55.62
>>314 はJIS順なのかな
Unicode順なら 一七三九二五八六十四

ここまで見た
  • 334
  •  
  • 2013/09/17(火) 18:49:54.69
漢数字を文字コードだけで機械的にソートするとか、どんだけ

ここまで見た
  • 335
  •  
  • 2013/09/17(火) 19:46:20.12
0100
0100
〇一〇〇
零百
十〇
〇壱〇〇
最適解が欧文の比じゃない数有るからなあ

ここまで見た
  • 336
  •  
  • 2013/09/17(火) 20:49:55.10
そういうのはフリガナとかヨミガナとかのソートの種を入れますし。

ここまで見た
  • 337
  •  
  • 2013/09/17(火) 21:07:54.19
1024*1024のビットマップフォントにして
黒の数でソートしようず

ここまで見た
  • 338
  •  
  • 2013/09/17(火) 21:56:58.21
それが黒だと誰が決めた

ここまで見た
  • 339
  •  
  • 2013/09/17(火) 22:02:47.20
黄色でもいいけどよ
モノクロ二値にすんだよハゲっが

ここまで見た
  • 340
  •  
  • 2013/09/17(火) 23:58:51.49
意味ない

ここまで見た
  • 341
  •  
  • 2013/09/18(水) 00:06:35.40
yes

ここまで見た
  • 342
  •  
  • 2013/09/18(水) 02:19:26.91
文字コードについて説明してある本が古くて使いものにならない、ってことになるとは、
最初に書いた人は想像してなかったろうな

ここまで見た
  • 343
  •  
  • 2013/09/18(水) 03:05:07.93
>>328
康熙字典の部首順。
だから漢数字が一七三九二五八六十四の順になったりする。

ここまで見た
  • 344
  •  
  • 2013/09/18(水) 03:21:07.49
なるほど部首か

ここまで見た
  • 345
  •  
  • 2013/09/21(土) 00:40:43.90
>>342
なわけねえべ。

ここまで見た
  • 346
  •  
  • 2013/09/23(月) 20:39:39.37
950 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 18:35:39.06 ID:i/lAwQriP
騸豚か。


951 名前:名無しの報告 投稿日:2013/09/23(月) 18:45:49.59 ID:21igwRGo0
>>950
文字実体参照、16進の数値文字参照を全板で禁止
数値文字参照は10進のみ、BBS_UNICODE=passの板で可


952 名前:あまチゴ ◆TIGOI/DrzHH9 投稿日:2013/09/23(月) 19:38:39.06 ID:i/lAwQriP
せん馬のせんがぁあああ


953 名前:名無しの報告 投稿日:2013/09/23(月) 19:49:53.10 ID:P916m9xr0
せん馬

去勢された牡馬の性別を表す競馬用語。センとも書かれる。
せんは馬に扇で、一部の雑誌やサイトでは騙という字が当てられていることがあるが、それは間違い。


http://qb5.2ch.net/test/read.cgi/sec2chd/1379117300/951 【規制議論板】質問でも雑談でもOKのスレッド★359

ここまで見た
  • 347
  •  
  • 2013/09/23(月) 22:53:29.07
何で10進参照だけ生き残ったの?

ここまで見た
  • 348
  •  
  • 2013/09/24(火) 08:49:43.08
2chの運営(=バカ)にまともな理屈を期待しても無駄

ここまで見た
  • 349
  •  
  • 2013/09/28(土) 07:58:37.70
この本屋って新宿駅近くにあるんだけど
部屋の区割り自体が迷路のように入り組んでいて
火事で停電になったら出口判らず逃げ遅れて死者多数出ると思う
http://www.dotup.org/uploda/www.dotup.org4535669.jpg

ここまで見た
  • 350
  •  
  • 2013/09/28(土) 11:57:32.13
何?唐突に怖いんだけど…よく見たら心霊系、みたいなネタ画像?

フリックゾンビ
フリックラーニング
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード