文字コード総合スレ part8 [sc](★0)
-
- 1
- 2012/11/30(金) 13:16:02.46
-
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
-
- 49
- 2013/01/04(金) 03:41:54.21
-
>>44
戦前に「天皇陛下」の一体活字を作った新聞社じゃないんだから。
-
- 50
- 2013/01/04(金) 04:29:39.37
-
ひょっとしてそれって、文選で間違えると打ち首にされるとかの回避策?
-
- 51
- 2013/01/04(金) 04:40:26.90
-
文中の「陛」文字頻度が低い上に特定の熟語にしか使われないからでしょ
-
- 52
- 2013/01/04(金) 14:51:44.58
-
>>48
http://blog.query1000.com/archives/21798078.html
http://blog.query1000.com/archives/21819386.html
http://blog.query1000.com/archives/21848658.html
http://blog.query1000.com/archives/21886099.html
四連作なのね。結構、裏話っぽくて面白かった。
-
- 53
- 2013/01/04(金) 15:16:53.92
-
ああ、例の本の深沢さんか。参考になったわ。
-
- 54
- 2013/01/04(金) 23:04:36.32
-
>>52
安岡も耄碌したな。トイレと天気の話しか出来ないのか。
-
- 55
- 2013/01/07(月) 14:54:11.70
-
>>50
北朝鮮方式か
-
- 56
- 2013/01/07(月) 14:56:08.81
-
あと、4文字の途中で改行することが許されないから、
(というか、直前で改行して必ず行頭に置くことになってるから)
という事情もあるな。
-
- 57
- 2013/01/08(火) 21:03:09.32
-
JIS Z 8903廃止なのね
-
- 58
- 2013/01/09(水) 07:20:34.61
-
ああYさんとこね
変体仮名字形の入札、濁点/半濁点つき字形のことを忘れているような
-
- 59
- 2013/01/09(水) 16:28:46.12
-
>>59
戸籍にも住基にも濁点/半濁点付き変体仮名は無いから
とりあえず最初のうちは作らないみたい
でも今後どうするかは謎
-
- 60
- 2013/01/09(水) 16:30:30.81
-
>>59
自分自身を指してしまったorz
-
- 61
- 2013/01/09(水) 22:23:43.57
-
そうなのか…じゃあ本当に行政専用になりそうだな
-
- 62
- 2013/01/11(金) 00:54:51.84
-
合成でなんとかしろって事ではないのかな。
アイヌ語の表現みたいに。
-
- 63
- 2013/01/11(金) 02:03:45.26
-
欧文のストロークみたいな感じで
-
- 64
- 2013/01/12(土) 01:02:43.90
-
>>63
kwsk
-
- 65
- 2013/01/13(日) 09:21:45.76
-
ふむ
-
- 66
- 2013/01/14(月) 22:23:13.81
-
ほう
-
- 67
- 2013/01/14(月) 23:00:03.96
-
すべてが順調にいったとしても
使えるようになるのは2015年頃かのう
-
- 68
- 2013/01/16(水) 15:44:53.71
-
拡張Fきてるし
-
- 69
- 2013/01/16(水) 18:54:26.26
-
irgはいつの頃からか記念写真やめちゃったのね
-
- 70
- 2013/01/19(土) 00:08:29.61
-
Ext Fまで来ると、もうIPAmjとGlyphWikiくらいしか
実装されないんじゃなかろーか
-
- 71
- 2013/01/19(土) 23:36:28.62
-
ExtFどこにきてるの
-
- 72
- 2013/01/20(日) 07:02:56.46
-
あなたのうしろよ
-
- 73
- 2013/01/20(日) 21:41:44.70
-
中国語の漢字もう疲れた... 偏が簡体になったやつがやたらコードポイントを
消費しているような。
もう簡体と繁体もunifyすればよかったんじゃんw
-
- 74
- 2013/01/20(日) 23:15:17.97
-
繁体:簡体が多対一で対応してるのとかへのルール作りを考えるとユニるのがめんどくさい
-
- 75
- 2013/01/20(日) 23:26:09.98
-
Ext.Fどこで見られる?
-
- 76
- 2013/01/23(水) 00:14:21.88
-
unicode とか JIS X 0208 だと、ASCII文字(記号含む)の全角版って、互換性維持の為にあるものだよね?
JIS X 0208 だと、ほぼ使うなと同等なことが書いてあるけど、
今の unicode standard だと使っても全然問題ないみたいに書いてある。
現実的に、フォントと多くの表示環境では、レンダリングされるときのマージンとかスペーシングを考えると、
日本語を書くときは全角を使った方が見栄えが良くなると思う。
ASCII文字の全角版を使わないという選択はとれないんではないの?
日本人は分かち書きなんてしないから、マージンとかスペーシングを気にしないのかもしれないが、
ラテン文字を使う外国人はマージン・スペーシングに関して全角の方が見栄えがいいから、
unicode standard で禁止されてないし、全角文字を使う風潮が流行るんではないかな。このままほっとくと。
実際、CJK文字を含むテキストで何で半角記号(括弧とか、&とか))を使うのか?全角記号を使うべきではって外国人に言われたし。
まともな反論できなかったわ。
-
- 77
- 2013/01/23(水) 00:32:25.32
-
英数字に全角文字使えよ
-
- 78
- 2013/01/23(水) 00:40:31.84
-
>>77
まあ、日本語で書くときの話をしてるから。それに解決になってないし。
追記しとくと、
(日本語)
みたいに全角括弧でくくった場合、括弧の前後にマージンがあるフォントとないフォントがあると思う。
これを半角にしてしまうと、ほとんどのフォントでマージンがないから、前後に空白文字を入れないと、マージンが無くなってしまう。
これが見た目に影響してしまうんだよね。
また、縦書きの場合に
おしっこ&うんこ
みたいに書くと、全角&は正立するが、半角&は90度回転する環境がほとんどだと思う。(?!とかもそうかもね)
じゃあ、CJKだと普通の文字は正立するから、全角で書かないといけないよねってことになる。
今すぐ役に立つものを作る場合は、規格より、現実を優先させないといけないしなぁ。
っつーか、なんでunicodeの互換エリアって使っても問題ないみたいになってしまったんだ?
-
- 79
- 2013/01/23(水) 01:01:38.61
-
>>78
全角って単にコードの話で、
マージンやスペーシングがどうかなんて規定されてないだろ。
横幅が半分でもコードが全角ならそれは全角だよ。
-
- 80
- 2013/01/23(水) 01:15:32.71
-
>>79
そりゃそうだけど、じゃあどうするべきなの?
俺はマージンとか縦書きの時の配置はレンダラが適切に処理しろと思うけど、
現実PCの表示環境でそんなの気にしてないし。
フォント制作者も文字の効用に合わせて作ってるんだろ?
半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。
現実に合わせても将来がない上に、規格にそってもまともなレンダリングがされない現状って。
-
- 81
- 2013/01/23(水) 07:33:02.14
-
NEC PC-98シリーズには、2バイト半角文字がある。
-
- 82
- 2013/01/23(水) 08:00:06.14
-
括弧とかは全角版を「スペースが予め含まれた括弧」みたいに再定義しておくべきだったかもしれんね。
-
- 83
- 2013/01/23(水) 12:42:32.90
-
縦書きの時に何を正立させて何を回転させるかは今UTR50でやってる。
もっとも、外野が口を突っ込みすぎて座礁しかかってるけど。
-
- 84
- 2013/01/23(水) 13:40:47.76
-
どうせSJIS⇔Unicode変換には演算入るんだから英数やキリルのJIS全角文字はダイアクリティカルマーク様にコンバインで収録すべきだった
-
- 85
- 2013/01/23(水) 14:13:01.99
-
East Asian WidthがAmbiguousなやつどうすんだよって問題も未だ解決されてないし
どんなとき縦中横にするのかとか文字コードだけで解決できる問題とは思えないよな
-
- 86
- 2013/01/23(水) 15:05:26.83
-
>>80
それは単にあんたの使ってる環境やフォントの機能不足だろ。
>半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。
ヒラギノは文字幅の設定8種類持ってて切替えられる。
OSX上でプロポーショナルにも全角/半角側に統一とかも設定次第で好きにできる。
-
- 87
- 2013/01/23(水) 16:45:24.79
-
「AAAAAA」が全く同じ文字の連続に見えるようなフォントって話だと思ってたけど
OSX+ヒラギノの環境ではそれが可能ってことであってる?
-
- 88
- 2013/01/23(水) 17:14:59.80
-
>>87
そう、OpenTypeの機能。
OSXは標準のテキストエンジンでサポートしてる。
他のプラットフォームでも真面目にサポートしてれば使える。
-
- 89
- 2013/01/23(水) 17:43:27.76
-
WinだとDirectWriteでやることになるのかな
-
- 90
- 2013/01/23(水) 17:56:57.04
-
同じ文字には同じコードを割り当てるべきだと思うの
-
- 91
- 2013/01/23(水) 18:44:14.32
-
あれ、なんか話題のレベルが落ちてきてない?
-
- 92
- 2013/01/23(水) 19:20:18.78
-
ンとソのちがいは、日本人ならわかるけど
カタカナのベ
ひらがなのべのちがいは、日本人でもわからん
-
- 93
- 2013/01/23(水) 19:23:02.00
-
シとツのちがい
うとラのちがい
-
- 94
- 2013/01/23(水) 19:27:37.37
-
>>93
これだね
http://livedoor.blogimg.jp/conbul/imgs/9/7/97efb758.gif
-
- 95
- 2013/01/23(水) 21:38:01.20
-
>>92
何故へとヘではなくべとベなのか
-
- 96
- 2013/01/24(木) 01:29:41.99
-
>>86
OSXは使った事ないし知らなかったわ。すまん。
その外国人もマックユーザっぽいから、そういう風なレンダリングできるのを自分で見れば納得するかも。
You & I も あなた&わたし も ひろゆき(2ch管理人) も hirokyuki (the founder of 2ch) も
前後の文字を見て適切な字形とマージンを自動選択できる表示ソフトがあるってことだよね。
その外国人は上みたいな文字列を適切に表示させることが出来る環境なんて見たことないって言ってたから、
なにか適切な設定してやらないといけないってことかな。どうすればうまく表示させられるの?
-
- 97
- 2013/01/24(木) 04:29:08.26
-
Unicode Consortiumの内部文書へのパスワードを解除するって
ものすごい決断だなあ。これまで水面下でしてきたことも
これからすることもすべて丸裸か…
-
- 98
- 2013/01/24(木) 05:26:08.43
-
>>90
思うね。ふたつあるΩに、つい「オメーガ悪い!」と叫んじまったぜぃ
-
- 99
- 2013/01/24(木) 13:30:47.01
-
ユニコードは日中韓の同じ文字に同じコードを割り当てた所に問題が有った訳だが・・・
このページを共有する
おすすめワード