facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 415
  •  
  • 2013/10/30(水) 19:14:42.08
ユニコードにはあるけど。

ここまで見た
  • 416
  • 411
  • 2013/10/30(水) 19:23:32.84
ユニコード環境なら使えるのは知っています。
大文字と小文字の2文字を追加するだけで良いのになんで日本語の文字集合に入れなかったんでしょうか?
漢字の異体字みたいに青天井化する恐れも無かったのに。

ここまで見た
  • 417
  •  
  • 2013/10/30(水) 19:30:02.53
ちょっとごめん。サーカムフレックスって「^」ですよね?
ローマ字だとマクロンじゃないですか?

ここまで見た
  • 418
  • 411
  • 2013/10/30(水) 19:45:41.02
交通機関や民間では地名人名にヘボン式ローマ字でマクロンが使われることがありますが

正式な日本語のラテン文字転記である訓令式ではサーカムフレックスが使われます。

>1947年(昭和22年)の文部省通達[17](訓令式とヘボン式の両方を解説していた)ではサーカムフレックスとアポストロフィを使うとしており、
1937年(昭和12年)の内閣訓令が事務的な手違いで誤っていたと言われているが、昭和20年代の教育現場(小学校4〜6年生)ではどちらでも良いと教えるように文部省が指導していた。


例:市の公文書でサーカムフレックス付きオーが使われています。
http://www.city.nagaoka.niigata.jp/dpage/kokubun/chikyuhiroba/konnichiwa/newsletter/Vol.252.pdf

ここまで見た
  • 419
  •  
  • 2013/10/30(水) 20:04:24.94
歳がバレただけか。言わなきゃよかった

ここまで見た
  • 420
  •  
  • 2013/10/30(水) 21:30:42.70
JISに「合成用丸」があることからも分かるように、
アクセント記号は合成でなんとかするつもりだったんだろうよ。

ここまで見た
  • 421
  •  
  • 2013/10/30(水) 21:32:09.65
今は合成用丸という名前じゃなくなってるのか…

ここまで見た
  • 422
  •  
  • 2013/10/30(水) 21:43:15.81
◯囲い文字は青天井化しそうだから合成するのは合理的かもしれないけど
ローマ字で長音は母音だけだよ。AIUEOaiueoそれぞれにマクロン付きとサーカムフレックス付きを入れても20文字だけじゃん。
なんで入れなかったんだろうね。

ここまで見た
  • 423
  •  
  • 2013/10/30(水) 21:51:09.94
JIS X 0213に入ってるんだからええやん

ここまで見た
  • 424
  • 411
  • 2013/10/30(水) 23:01:56.66
それもそうですね。

ここまで見た
  • 425
  •  
  • 2013/10/31(木) 04:21:14.96
昔は「漢字コード」って言ってたくらいだから
みんな非漢字部分にはあまり意識を払ってなかったのかもね

ここまで見た
  • 426
  •  
  • 2013/10/31(木) 12:21:54.63
日本人はローマ字なんて殆ど使ってないしなあ。

0208や0212の頃は、漢字でさえまだあれやこれが足りないって議論が盛んにあった頃で、
ローマ字の長音表記に使う長音記号付きの母音字なんてどうでも良かったんじゃない?
変体仮名や西欧のアクセント記号付きアルファベットの方がまだ需要があったんじゃないかと。

和言葉には長音字はないから国語屋も興味薄そう。

ここまで見た
  • 427
  •  
  • 2013/10/31(木) 23:44:32.72
これらのカタカナをユニコードに入れてほしい。
一時期存在したわけだし、入れる資格はあると思う。

ヤ行イ - Wikipedia
http://ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A4

ヤ行エ - Wikipedia
http://ja.wikipedia.org/wiki/%E3%83%A4%E8%A1%8C%E3%82%A8

わ行う - Wikipedia
http://ja.wikipedia.org/wiki/%E3%82%8F%E8%A1%8C%E3%81%86

そうすれば
ear 耳 イアー
year 年 ⊥アー (似た記号で代用)
を区別できるのにね。

韓国のわけのわからない試作ハングルよりは実用価値はあると思う。

ここまで見た
  • 428
  •  
  • 2013/11/01(金) 00:00:51.79
一定の用例があれば符号化される可能性はあるだろうけど
五十音図だけだと厳しい気がする。文を綴った例がないと

ここまで見た
  • 429
  •  
  • 2013/11/01(金) 00:37:49.21
既に入ってる「江」「衣」が有効活用されてるかといえばされてないのよね。
やっぱり、文字コードに入るだけじゃなくて主要な環境でデフォルトで表示できて、入力も出来るというのが普及の最低ラインになるんじゃなかろうか。

ここまで見た
  • 430
  •  
  • 2013/11/01(金) 00:52:02.50
> 普及の最低ライン

何の話だ?

ここまで見た
  • 431
  •  
  • 2013/11/01(金) 01:12:42.55
金属活字の活版印刷の時代にそれらのカナの活字が造られて使われていたかどうかが大きかったのかも。

ここまで見た
  • 432
  •  
  • 2013/11/01(金) 01:27:53.75
フォント屋向けにUnicodeの日本語用サブセットみたいなのが必要なんだろうな
今だとAJ1がそれに近いか

ここまで見た
  • 433
  •  
  • 2013/11/01(金) 01:45:50.33
どのフォントでも対応するレベルの現実的な規模のサブセットは0213なんだろうな。
だからそこから外れてるKana Supplementはほったらかされる。

ここまで見た
  • 434
  •  
  • 2013/11/01(金) 01:56:41.54
JIS X 0213もAdobe-Japan1も最後に改訂されたのは9年前だっけ
後者は汎用電子がトリガーになって1-7が来るかなと思ったもんだけど

ここまで見た
  • 435
  •  
  • 2013/11/01(金) 02:42:50.59
JIS X 0213は今後もサブセット集合として存在意義があると思う。Shift-JIS200Xとかはお笑い種になっちゃったけど

ここまで見た
  • 436
  •  
  • 2013/11/01(金) 02:44:49.61
そうだね
JIS信者 安岡信者の心のより所として必要だね

ここまで見た
  • 437
  •  
  • 2013/11/01(金) 12:22:17.42
>>435
JIS X 0213なんて意義はもうほぼないだろw
文字コード屋以外には。
世間では既にUnicode+Adobe-Japan1で廻ってる。

ここまで見た
  • 438
  •  
  • 2013/11/01(金) 12:23:29.58
> Adobe-Japan1
< Adobe-Japan1フォント

ここまで見た
  • 439
  •  
  • 2013/11/01(金) 13:24:11.90
JavaScriptにようやく正規化とサロゲートペアのメソッドが入るみたいで安心

ここまで見た
  • 440
  •  
  • 2013/11/01(金) 15:38:04.53
>>436 TRON信者は電波お花畑板という適切な板に行ってください

ここまで見た
  • 441
  •  
  • 2013/11/01(金) 16:51:12.98
>>439
Unicodeすらまともにサポートしてなかったのか

ここまで見た
  • 442
  •  
  • 2013/11/01(金) 19:49:26.19
Adobe-Japan1フォントは、欧文がダメだからなー

ここまで見た
  • 443
  •  
  • 2013/11/01(金) 22:50:40.29
JavaScriptは仕様を巡る争いで数年無駄にしたからなあ

ここまで見た
  • 444
  •  
  • 2013/11/01(金) 22:55:49.16
仕様を巡る争いなんてないよ。
そもそもネットスケープの独自言語だったわけだし。

単に標準化委員会が、XHTMLなんかはやらせようとしてて
JavaScirptに見向きもしなかっただけ。

標準化委員会が最低限のDOM以外なにも決めようとしないので
各ブラウザベンダーは独自で便利な機能を実装していった。
この時代に標準はない。

それに業を煮やしたブラウザベンダーがJavaScriptを
ふんだんに取り入れたHTML5を作り出した。
ここからやっとJavaScriptの仕様の話に入る。

ここまで見た
  • 445
  •  
  • 2013/11/01(金) 22:58:20.53
ECMAScript 4でググるよろし

ここまで見た
  • 446
  •  
  • 2013/11/01(金) 23:23:10.92
図解雑学文字コードは分かりやすくて良い本なので
2002年以降の動向を追加した改訂版を出してほしい。

ここまで見た
  • 447
  •  
  • 2013/11/02(土) 03:46:05.18
グリフ集合のデファクトを一企業に握られてるというのは
あんまり健全じゃないよな

ここまで見た
  • 448
  •  
  • 2013/11/02(土) 12:52:30.79
Adobeのことかー!!

ここまで見た
  • 449
  •  
  • 2013/11/02(土) 23:40:23.63
Winも8.1でAJ16フォントを採用したもんなー

ここまで見た
  • 450
  •  
  • 2013/11/03(日) 00:24:53.83
ん、そうなのか

ここまで見た
  • 451
  • 448
  • 2013/11/03(日) 00:26:29.81
ノリで言っただけで
>>447がどの企業のことを指していたのかはわからないんだけどね。

ここまで見た
  • 452
  •  
  • 2013/11/05(火) 01:31:55.84
WG2更新されてゅぅ
でも日本に関係あるのは梵字くらいか

ここまで見た
  • 453
  •  
  • 2013/11/05(火) 05:30:08.53
ユニコード戦記の新古書を神田古本まつりでゲット

ここまで見た
  • 454
  •  
  • 2013/11/05(火) 21:37:05.50
安岡信者がこんなところにも
http://www.mishimaga.com/tonarimachi/26.html

ここまで見た
  • 455
  •  
  • 2013/11/06(水) 01:58:32.56
ここはお前個人の閻魔帳じゃないんだからせめて何が気に入らないのか第三者に伝わるようなレベルで具体的に説明してくれ。

ここまで見た
  • 456
  •  
  • 2013/11/06(水) 21:30:15.62
マジ基地のTRON信者だから、何を言っても無駄です

ここまで見た
  • 457
  •  
  • 2013/11/06(水) 23:06:31.14
安岡センセイも最近はマイナンバーとタイプライターばかりだからな

ここまで見た
  • 458
  •  
  • 2013/11/06(水) 23:08:18.62
安岡は最近は2ちゃんで自分への否定的なレスを見つけては
TRON信者だ!とか騒ぐだけ

ここまで見た
  • 459
  •  
  • 2013/11/07(木) 01:44:24.77
良くも悪くも特別視することないと思うけど
別にJSC2の委員ってわけでもないし>>11

ここまで見た
  • 460
  •  
  • 2013/11/07(木) 11:36:23.41
タイプライターの件で必死に噛みついてた狂信的坂村信者以外に、
安岡氏のやることなすことケチつける奴なんて考えられんw

ここまで見た
  • 461
  •  
  • 2013/11/07(木) 23:26:55.37
>>445
4で数年も無駄にしてない。

ここまで見た
  • 462
  •  
  • 2013/11/08(金) 02:07:42.03
ルーブル記号が決まったらUnicode 7.0の前に6.4が来るかな…

ここまで見た
  • 463
  •  
  • 2013/11/10(日) 03:44:23.37
>>459
1997からJIS委員対反JISの戦いなんてないしな。
文句ある奴は意見出せって流れになったので。

争点としては残った包摂基準の良し悪しについても、今はIVSがあるし。

争点がほとんどないのがこのスレの伸びにも現れてる。

ここまで見た
  • 464
  •  
  • 2013/11/10(日) 20:44:11.17
ITU定義の電話ボタンの*(star)と#(square)が、それぞれ、
U+26B9 SEXTILE
U+2317 VIEWDATA SQUARE
に包摂される模様。
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4495.pdf

ここまで見た
  • 465
  •  
  • 2013/11/10(日) 20:56:57.81
しめす偏の「ネ」の字形も「示」の字形差も包摂しちゃって書体のデザイン差にしてしまえば良いのだ。

ここまで見た
  • 466
  •  
  • 2013/11/11(月) 02:12:34.24
>>464
いいから、その埃だらけの画像はやめてくれw

砂時計アラームタイマー
フリック回転寿司
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード