facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 80
  •  
  • 2013/01/23(水) 01:15:32.71
>>79
そりゃそうだけど、じゃあどうするべきなの?
俺はマージンとか縦書きの時の配置はレンダラが適切に処理しろと思うけど、
現実PCの表示環境でそんなの気にしてないし。

フォント制作者も文字の効用に合わせて作ってるんだろ?
半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。

現実に合わせても将来がない上に、規格にそってもまともなレンダリングがされない現状って。

ここまで見た
  • 81
  •  
  • 2013/01/23(水) 07:33:02.14
NEC PC-98シリーズには、2バイト半角文字がある。

ここまで見た
  • 82
  •  
  • 2013/01/23(水) 08:00:06.14
括弧とかは全角版を「スペースが予め含まれた括弧」みたいに再定義しておくべきだったかもしれんね。

ここまで見た
  • 83
  •  
  • 2013/01/23(水) 12:42:32.90
縦書きの時に何を正立させて何を回転させるかは今UTR50でやってる。
もっとも、外野が口を突っ込みすぎて座礁しかかってるけど。

ここまで見た
  • 84
  •  
  • 2013/01/23(水) 13:40:47.76
どうせSJIS⇔Unicode変換には演算入るんだから英数やキリルのJIS全角文字はダイアクリティカルマーク様にコンバインで収録すべきだった

ここまで見た
  • 85
  •  
  • 2013/01/23(水) 14:13:01.99
East Asian WidthがAmbiguousなやつどうすんだよって問題も未だ解決されてないし
どんなとき縦中横にするのかとか文字コードだけで解決できる問題とは思えないよな

ここまで見た
  • 86
  •  
  • 2013/01/23(水) 15:05:26.83
>>80
それは単にあんたの使ってる環境やフォントの機能不足だろ。
>半角と全角でグリフもマージンとかも全く同じフォントなんてほとんど無いし。
ヒラギノは文字幅の設定8種類持ってて切替えられる。
OSX上でプロポーショナルにも全角/半角側に統一とかも設定次第で好きにできる。

ここまで見た
  • 87
  •  
  • 2013/01/23(水) 16:45:24.79
「AAAAAA」が全く同じ文字の連続に見えるようなフォントって話だと思ってたけど
OSX+ヒラギノの環境ではそれが可能ってことであってる?

ここまで見た
  • 88
  •  
  • 2013/01/23(水) 17:14:59.80
>>87
そう、OpenTypeの機能。
OSXは標準のテキストエンジンでサポートしてる。
他のプラットフォームでも真面目にサポートしてれば使える。

ここまで見た
  • 89
  •  
  • 2013/01/23(水) 17:43:27.76
WinだとDirectWriteでやることになるのかな

ここまで見た
  • 90
  •  
  • 2013/01/23(水) 17:56:57.04
同じ文字には同じコードを割り当てるべきだと思うの

ここまで見た
  • 91
  •  
  • 2013/01/23(水) 18:44:14.32
あれ、なんか話題のレベルが落ちてきてない?

ここまで見た
  • 92
  •  
  • 2013/01/23(水) 19:20:18.78
ンとソのちがいは、日本人ならわかるけど
カタカナのベ
ひらがなのべのちがいは、日本人でもわからん

ここまで見た
  • 93
  •  
  • 2013/01/23(水) 19:23:02.00
シとツのちがい
うとラのちがい

ここまで見た
  • 94
  •  
  • 2013/01/23(水) 19:27:37.37
>>93
これだね
http://livedoor.blogimg.jp/conbul/imgs/9/7/97efb758.gif

ここまで見た
  • 95
  •  
  • 2013/01/23(水) 21:38:01.20
>>92
何故へとヘではなくべとベなのか

ここまで見た
  • 96
  •  
  • 2013/01/24(木) 01:29:41.99
>>86
OSXは使った事ないし知らなかったわ。すまん。
その外国人もマックユーザっぽいから、そういう風なレンダリングできるのを自分で見れば納得するかも。
You & I も あなた&わたし も ひろゆき(2ch管理人) も hirokyuki (the founder of 2ch) も
前後の文字を見て適切な字形とマージンを自動選択できる表示ソフトがあるってことだよね。
その外国人は上みたいな文字列を適切に表示させることが出来る環境なんて見たことないって言ってたから、
なにか適切な設定してやらないといけないってことかな。どうすればうまく表示させられるの?

ここまで見た
  • 97
  •  
  • 2013/01/24(木) 04:29:08.26
Unicode Consortiumの内部文書へのパスワードを解除するって
ものすごい決断だなあ。これまで水面下でしてきたことも
これからすることもすべて丸裸か…

ここまで見た
  • 98
  •  
  • 2013/01/24(木) 05:26:08.43
>>90
思うね。ふたつあるΩに、つい「オメーガ悪い!」と叫んじまったぜぃ

ここまで見た
  • 99
  •  
  • 2013/01/24(木) 13:30:47.01
ユニコードは日中韓の同じ文字に同じコードを割り当てた所に問題が有った訳だが・・・

ここまで見た
  • 100
  •  
  • 2013/01/24(木) 15:05:11.07
iモードはなぜJIS X 0208にすでにある♪を絵文字に追加したのかw

ここまで見た
  • 101
  •  
  • 2013/01/24(木) 17:40:08.34
http://www.nttdocomo.co.jp/service/communication/imode_mail/function/pictograph/
「るんるん」であって八分音符じゃないから
まあ意味も同じな「!」まで追加してるし色つけたいとかアイコンのかわりに使いたいとか
絵文字の水増ししたいとかそういう理由なんだろうな
どちらかといえば「黒ハート(赤)」のほうが納得いかないし

ここまで見た
  • 102
  •  
  • 2013/01/24(木) 18:28:41.15
絵文字なんて、ミクシィみたく数値参照みたいな形式でいいのに。
なんでコードポイントなんか与える必要があるんだよ。

ここまで見た
  • 103
  •  
  • 2013/01/24(木) 20:38:24.03
絵文字は、排除すべきだ

ここまで見た
  • 104
  •  
  • 2013/01/24(木) 21:39:41.69
無理です

ここまで見た
  • 105
  •  
  • 2013/01/24(木) 21:47:40.50
使うものだけを各自subset化する

ここまで見た
  • 106
  •  
  • 2013/01/25(金) 06:30:50.06
>>103
排除はどうかと思うが、
Unicodeに日本の3キャリアのみの変換テーブルねじ込んだのは許せん
しかも往復できないし

ここまで見た
  • 107
  •  
  • 2013/01/25(金) 09:59:10.09
>しかも往復できないし

ここだよね。

キャリアの絵文字相互変換はぶっちゃけ「なんとなくこんな感じだよね」レベルなんだから、
ユニコード収録のタイミングで半ば強引に整理して、
キャリアのサーバー側を“権威ある国際規格”にあわせるべきだった。

中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。

ここまで見た
  • 108
  •  
  • 2013/01/25(金) 10:38:04.63
各キャリアの私用領域絵文字は緩やかに廃止して
全部画像ベースのデコメ絵文字に移行すれば何も問題なかったのに
文字コードオタクが調子に乗るから

ここまで見た
  • 109
  •  
  • 2013/01/25(金) 10:55:54.76
>中の人も「後世まで残すとわかってたらもっとマジメに作ったのに」って思っただろ絶対。

ないわ

ここまで見た
  • 110
  •  
  • 2013/01/25(金) 17:19:55.61
>>88
それってCoreTextでfont featureをセットするみたいな話のことですか?
CoreTextをあまり真剣に使ったことがなかったので後学のために。

ここまで見た
  • 111
  •  
  • 2013/01/25(金) 17:48:51.40
>>110
普通にフォントパネルから指定できる。
左下のポップアップメニューからTypography選んでみ。
ずっと前からサポートしてるOSXの基本機能/基本操作だよ。

ここまで見た
  • 112
  •  
  • 2013/01/27(日) 04:02:47.85
>>111
はい。
UI的にはそうなんですけど、プログラム的にはNSTextViewとNSFontPanel
の組み合わせで、だけどそれをコントロールするAPIはないような、と。
ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。

「ターミナルでの」半角全角というのはレガシーなエンコーディングにおいて
1バイトか2バイトかで文字幅処理していた名残だから、フォントのデザインという
より文字コードの問題なんだけど、OpenTypeのフィーチャーは有効かな? と。
あくまでもターミナルでの全角半角問題に限定しての話ですが。

で、OS XのターミナルはCoreTextで作られているので... というのが個人的な今ココ。
ちょっとごにょごにょ試してみます。

ここまで見た
  • 113
  •  
  • 2013/01/27(日) 14:38:22.59
>>112
フォントによってサポートしてるfeature違うから、適切なオプションを設定すれば良いはず。
>ちなみにこのメニューってOS Xのどのバージョンからありましたっけ。
OSX 10.2辺りからじゃないかな? 手元で一番古い10.4でも普通に使える。
>で、OS XのターミナルはCoreTextで作られているので...
それは最近の話だね。CoreText以前もfont featureはATSUIでサポートされてる。

ここまで見た
  • 114
  •  
  • 2013/01/28(月) 22:43:40.82
「ここに晒しておく。」なんて
あの人は発想がちゃねら並みだな…

ここまで見た
  • 115
  •  
  • 2013/01/28(月) 23:05:39.65
実名でやってるだけ俺らよりマシだろ

ここまで見た
  • 116
  •  
  • 2013/01/31(木) 10:37:53.41
安岡センセイ
実はバリバリのちゃねらーだろ

ここまで見た
  • 117
  •  
  • 2013/01/31(木) 10:57:25.02
>>114
安岡センセイが「晒しておく」って書いてる時は文体にかなり怒りを感じる。
本気で怒ってるんだろうと思う。

http://slashdot.jp/~yasuoka/journal/562403
http://slashdot.jp/~yasuoka/journal/535124
http://slashdot.jp/~yasuoka/journal/514117
http://slashdot.jp/~yasuoka/journal/494946

ここまで見た
  • 118
  •  
  • 2013/02/01(金) 00:57:01.23
ふむ

ここまで見た
  • 119
  •  
  • 2013/02/01(金) 03:06:59.67
阿辻教授の方へ訊きに行ったのが気に障ったのかしら

ここまで見た
  • 120
  •  
  • 2013/02/01(金) 06:27:21.26
>>117
センセイも時々ボケはるからお互い様な感じはする
IVSの時はただの馬鹿かと思った

ここまで見た
  • 121
  •  
  • 2013/02/01(金) 21:58:56.46
>>120
kwsk

ここまで見た
  • 122
  •  
  • 2013/02/01(金) 22:02:49.89
>>117
「晒しておく」とは書いてないが、かなり怒ってる感じだぞ
http://joi.jlc.jst.go.jp/DN/JST.JSTAGE/johokanri/55.826

ここまで見た
  • 123
  •  
  • 2013/02/01(金) 23:43:45.98


ここまで見た
  • 124
  •  
  • 2013/02/02(土) 17:53:12.36
??

ここまで見た
  • 125
  •  
  • 2013/02/02(土) 20:59:26.62
リンク切れてるぞ

ここまで見た
  • 126
  •  
  • 2013/02/03(日) 00:32:44.49
落ちてるのかな

ここまで見た
  • 127
  •  
  • 2013/02/03(日) 09:20:06.52
昨日はPDFでダウンロードできたよ

ここまで見た
  • 128
  •  
  • 2013/02/03(日) 22:02:28.55
>>113
少し遊んでみました。なるほどヒラギノというのはいろんなテーブルを持ってるんですね。
こういうテーブルのせいでフォントが過剰に大きくなったりしないのかな。

個人的にOS Xからしばらく遠のいていましたが、ふと気がつくとテキストエディットが
縦書き対応に、SafariはIVSに対応しているようで。
しかしIVS->グリフの対応はどのレイヤーで処理しているのかな?

ここまで見た
  • 129
  •  
  • 2013/02/04(月) 00:18:37.69
>>122
やっと読めた
怒ってるというよりは業を煮やした感じ

ここまで見た
  • 130
  •  
  • 2013/02/04(月) 05:38:16.47
>>128
ヒラギノ角ゴがときどき怪しげな表示をするのは、そのせいなんだろうか。
文字が重なったり、わけのわからんところでボーンとアキができたり。
こういうのはスレチ? MacとかWordとかのスレでやったほうがいいの?

お絵かきランド
フリックラーニング
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード