文字コード総合スレ part8 [sc](★0)
-
- 1
- 2012/11/30(金) 13:16:02.46
-
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
-
- 490
- 2013/11/16(土) 18:44:41.16
-
なんや!
-
- 491
- 2013/11/16(土) 19:15:02.84
-
ラニマル文字
-
- 492
- 2013/11/16(土) 21:30:45.57
-
>>489の母体はこれかな
ttp://mojikiban.ipa.go.jp/
-
- 493
- 2013/11/16(土) 23:52:46.10
-
議事録面白い
変体仮名の検討つづいてたんだ
-
- 494
- 2013/11/17(日) 01:23:43.73
-
なんの議事録?
-
- 495
- 2013/11/17(日) 02:05:15.96
-
492の委員会活動状況ってところ
何をどう符号化するかみたいな話がのってる
-
- 496
- 2013/11/17(日) 03:12:57.30
-
変体仮名ってどんだけ使用実績あるの?
戸籍統一文字と相互変換することなんてありえないし。
またゴリ押しして複雑化するのだけはやめて欲しい。
-
- 497
- 2013/11/17(日) 11:17:00.18
-
またというのは?
-
- 498
- 2013/11/17(日) 11:52:59.91
-
変体仮名は和歌の世界では日常茶飯時で当然活字もある。
-
- 499
- 2013/11/17(日) 15:58:49.35
-
古典を電子化するために必要ってことだよね。
でも変体仮名ってゴシック体とか明朝体の活字が使われる頃には既に使われなくなっていたから
楷書体の字形しか無いよな?
ゴシック体の変体仮名ってマヌケそう。
-
- 500
- 2013/11/17(日) 18:52:14.42
-
散々言われ尽くしたことを何故いまさら
-
- 501
- 2013/11/18(月) 01:20:17.70
-
>>500
結論出たならいいけどさ
登録するなら必要な話でしょ。
手書き限定ならそもそも活字化出来ない→誰も実装しない→登録する必要性なし
って判断されるかもよ。
-
- 502
- 2013/11/18(月) 01:21:25.80
-
>>498
活字なんてあったっけ?
-
- 503
- 2013/11/18(月) 02:12:31.08
-
行政で必要なものだけ符号化すりゃいいんだよ的な話になってるのは気になるけど
どのみち於可古志八みたいな有名どころは入ることになるか
-
- 504
- 2013/11/18(月) 11:47:29.93
-
>>502
当然あった。例えば「築地活文舎 変体仮名」でググれ。
基本的なことも知らないのだから活字には無知だろうに、
どうして「あったっけ?」なんていい方が出来るのか...
-
- 505
- 2013/11/18(月) 18:52:54.82
-
この会社ならいい感じの変体仮名のフォント作れそうだな。
http://fontworks.co.jp/font/tsukushi/tsukushiboldmin/R.html
-
- 506
- 2013/11/18(月) 22:20:12.19
-
そもそも常識的に考えて「変体仮名の活字はなかった」なんておかしいだろ
-
- 507
- 2013/11/18(月) 23:35:43.62
-
弘道軒清朝体が出てきて懐かしくなった
-
- 508
- 2013/11/19(火) 16:23:32.63
-
>>4-6
UTF-8に統一しろよって言いに来たけどテンプレ読んで頭が下がりました。
すいませんでした。
-
- 509
- 2013/11/19(火) 16:51:04.04
-
>>4
>・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
テキストVRAMに書き込むのは、BIOSかコマンドの仕事。
直接書き込みたければコマンドが自分で変換する必要がある。
ちなみに1byteごとに色等の修飾属性1byteがつくから、漢字は4byte。
-
- 510
- 2013/11/19(火) 22:02:59.00
-
98のbiosは文字描画無いんじゃなかったっけ?
-
- 511
- 2013/11/19(火) 22:19:25.06
-
そもそもMS-DOSはShift_JISじゃないし。
>>4の様な安岡信者は相変わらず気が触れているな。
-
- 512
- 2013/11/19(火) 22:25:22.58
-
学参明朝などという八百長書体のせいで
字形の違いとデザイン差の問題がでたらめになってしまった。
学参明朝を撲滅せよ!
-
- 513
- 2013/11/20(水) 02:36:10.18
-
>>511
安岡のおっちゃんもCP932とShift_JISくらい区別ついてるよ
-
- 514
- 2013/11/20(水) 12:01:24.92
-
安岡はCP932とShift_JISの区別は付いているけど
シフトJISとShift_JISの違いがついていなくて
Shift_JISを妄信しているから困る
-
- 515
- 2013/11/20(水) 18:16:02.66
-
意味のわかんないことを一人で必死に連投してるのは何?
-
- 516
- 2013/11/20(水) 18:52:26.42
-
勉強してきて、どうぞ
-
- 517
- 2013/11/21(木) 10:41:36.55
-
「シフトJIS」なんて厳密な定義ない。>>514は馬鹿。
-
- 518
- 2013/11/21(木) 10:44:02.10
-
厳密な定義のない広義のシフトJISとShift_JISとが
区別できてないってことだろ
-
- 519
- 2013/11/21(木) 13:53:21.11
-
http://slashdot.jp/~yasuoka/journal/334730
↑この話な
-
- 520
- 2013/11/21(木) 16:13:00.62
-
MS-DOS全盛の時代にWindows-31Jがあったとは思えないんだが
-
- 521
- 2013/11/21(木) 16:49:54.99
-
>>519
これ読むと
誤解されてる方の意味での
「シフトJIS」ってのは
EUCにふさわしい名前だな
-
- 523
- 2013/11/21(木) 19:02:01.88
-
>Shift JIS系のコードの総称として「シフトJIS」
というのが世間の認識なんだけど、
安岡氏は代表であるMSのそれを「MS漢字コード」
という別物としてとらえている感があるような
-
- 524
- 2013/11/21(木) 19:12:37.27
-
「完敗」って書いてるじゃん
-
- 525
- 2013/11/23(土) 03:13:57.39
-
>>523
なんか前半と後半で文書繋がってないけど。
・総称をシフトJISと呼ぶことが多い
・CP932を安岡はMS漢字コードと言ってる
・シフトJISにCP932は含まれる
ってだけじゃないの。
で、スラドに書いてあるのはシフトJIS起源はどの会社かって話でしょ。
これに関しては安岡説は間違ってたと当人が認めてる。
-
- 526
- 2013/11/23(土) 08:31:16.26
-
読解力ないな
スラドのテーマは
「誤解されてる方の意味」の
>「Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが
>「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、
>すなわち「シフトJISコード」でした」
を言ったのはどこの会社の誰かソース出せ
ってことだろ
-
- 527
- 2013/11/23(土) 09:51:05.75
-
誤解されてる方
って何だ?
-
- 528
- 2013/11/23(土) 12:02:46.92
-
「これを読む限りでは」って限定してるじゃん
しかも今じゃ読めないし
-
- 529
- 2013/11/23(土) 12:07:18.05
-
安岡はともかく>>4あたりがよく分かっていないのは間違いない
-
- 530
- 2013/11/23(土) 12:48:58.53
-
4がっつーか当時の書き込みがそのまま使われてるだけだろ
www.bookshelf.jp/2ch/tech/1143375639.html
-
- 531
- 2013/11/23(土) 15:22:40.61
-
質問なのですが
CP932のNEC選定IBM拡張漢字と、IBM拡張漢字の領域で
重複している漢字がいくつかありますが
UTF8から変換した時、どちらに変換するのが正しいんでしょうか?
例) ?(U+7E8A)
NEC選定IMBだと
0xED40
IBMだと
0xFA5C
-
- 532
- 2013/11/23(土) 15:37:34.29
-
自己解決しました
Wikipedia先生に答えが書いてありました
> 「NEC選定IBM拡張文字」「IBM拡張文字」が重複する場合は、「IBM拡張文字」に統一
ありがとうございました
-
- 533
- 2013/12/01(日) 00:08:42.45
-
ふむ
-
- 534
- 2013/12/11(水) 00:37:39.94
-
ほう
-
- 535
- 2013/12/11(水) 03:30:11.10
-
へえ
-
- 536
- 2013/12/12(木) 16:23:27.72
-
ところでPRI 259は
-
- 537
- 2013/12/12(木) 20:41:09.81
-
TwitterでNさんが夜中にキレてたね
-
- 538
- 2013/12/14(土) 00:35:38.20
-
文字コードの判定の精度を確かめたいのですが
よく使われているテストセットみたいのってありますか?
-
- 539
- 2013/12/14(土) 00:38:42.17
-
>>536
IPAmjフォント専用みたいな感じだから
良くも悪くも一般ユーザーには関係なさそう
-
- 540
- 2013/12/14(土) 01:41:47.13
-
>>538
テスト用にサンプル集めてるところだわ
パスはUTF8で
http://www2.age2.tv/rd2/src/age5249.zip.html
どれもウェブページとかウェブから拾える
KOI7-switched windows-125[2347] IBM-12{61|64|65|68|76} ISO-2022-KR Big5-HKSCS辺りは見つけられてねえ
このページを共有する
おすすめワード