facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 364
  •  
  • 2013/10/10(木) 22:36:55.30
ここは基地外安岡信者が教祖を持ち上げるスレですね。
安岡用語でレスしないで下さい。

ここまで見た
  • 365
  •  
  • 2013/10/11(金) 10:24:30.38
基地外TRON信者はOS板に帰れ

ここまで見た
  • 366
  •  
  • 2013/10/11(金) 12:30:47.63
>>363のように安岡の取り巻きしか理解できない
レスをする方が基地外ではないかと

ここまで見た
  • 367
  •  
  • 2013/10/11(金) 12:33:53.50
数日ぶりに書き込みがあったと思えばいきなり争いごとか

ここまで見た
  • 368
  •  
  • 2013/10/11(金) 13:53:42.69
『歴博』No.180 [特集]文字とコンピュータ2013〜文字コードは踊る〜
> 鈴木卓治:文字とコンピュータと人間と 
> 安岡孝一:日本の文字コードの半世紀−国際社会との軋轢を越えて−
> 小形克宏:Windows外字と、その互換性をめぐる争い
> 川幡太一:異体字とIVS (異体字シーケンス)
> 上地宏一:グリフウィキ−あらゆる漢字・異体字を集積・共有する文字字形データベース
> 高田智和:コンピュータで書き表せる地名漢字
> 狩野宏樹:(インタビュー)フォントとIVS〜フォントベンダーの立場から〜

ここまで見た
  • 369
  •  
  • 2013/10/11(金) 13:57:13.42
>>368
安岡の取り巻きしかいないだろ

ここまで見た
  • 370
  •  
  • 2013/10/11(金) 18:24:19.95
単なる文字コード特集に見える

ここまで見た
  • 371
  •  
  • 2013/10/11(金) 21:55:32.62
>>368
http://www.book61.co.jp/book.php/N07886
これか。定価560円ってのは、高いのか安いのか。

ここまで見た
  • 372
  •  
  • 2013/10/11(金) 22:08:25.63
>Windows外字と、その互換性をめぐる争い
丸数字とか時計文字とか?

ここまで見た
  • 373
  •  
  • 2013/10/12(土) 12:21:44.57
>>372
「?」とか「?」とか「?」とか「?」とか

ここまで見た
  • 374
  •  
  • 2013/10/12(土) 12:24:00.80
?
JISでシフトJISに定義された文字がどうかしましたか?

ここまで見た
  • 375
  •  
  • 2013/10/12(土) 20:16:36.94
(´‥∀‥`)?

ここまで見た
  • 376
  •  
  • 2013/10/13(日) 00:59:36.46
3点リーダやダーシには、いまだに悩まされてるわ

ここまで見た
  • 377
  •  
  • 2013/10/13(日) 01:23:39.24
薄そう
http://www.rekishin.or.jp/rekihaku180mokuzi.jpg

ここまで見た
  • 378
  •  
  • 2013/10/13(日) 03:29:03.11
判ってないな
バベルの塔の逸話は
争ってないで協力しろって意味だよ

ここまで見た
  • 379
  •  
  • 2013/10/13(日) 04:20:47.49
できる人がしてください。奴隷は言いなりです。

ここまで見た
  • 380
  •  
  • 2013/10/15(火) 21:24:01.50
さて、台風が来るわけだが

ここまで見た
  • 381
  •  
  • 2013/10/15(火) 22:48:23.76
買ってきたコロッケをコード番号順に並べ換えてみようか。
ここは雑談スレじゃねえよ>俺

ここまで見た
  • 382
  •  
  • 2013/10/16(水) 19:35:44.13
さて、台風が行ってしまったわけだが

ここまで見た
  • 383
  •  
  • 2013/10/16(水) 23:58:48.34
Unicode6.3リリースされたけど誰も話題にしないね。

ここまで見た
  • 384
  •  
  • 2013/10/17(木) 00:18:02.40
何だっけ?

ここまで見た
  • 385
  •  
  • 2013/10/17(木) 00:32:13.34
んー、7.0.0が出たらネタも沢山あるが...

ここまで見た
  • 386
  •  
  • 2013/10/17(木) 22:06:30.58
文字の追加は6.2の時みたいにかなり少ないけどStandardized Variantsに互換漢字に対応するのが追加されたんだっけ。

ここまで見た
  • 387
  •  
  • 2013/10/17(木) 22:30:34.91
ああ、例のやつか

ここまで見た
  • 388
  •  
  • 2013/10/18(金) 23:50:33.84
ただでさえAdobe-Japan1と汎用電子でVSが分けられて問題になってるのにさらに混乱をもたらす事になりそうだ。
例えば「海」の旧字体はこれまでの6D77 E0100(Adobe-Japan1)と6D77 E0103(汎用電子)で表せてたが、更に互換漢字FA45の置換として6D77 FE00が追加されて異体字シーケンスが3通りになってしまったんだな。

あと「あれ?漢字の場合BMPのVSは使わないんじゃなかったっけ?」って言う人に対してちょっと面倒な説明をしないといけなくなったな。

ここまで見た
  • 389
  •  
  • 2013/10/19(土) 05:48:51.52
互換漢字はラウンドトリップ用というのが建前だから
新規文書では使わないのが正解
汎用電子もフォントがIPAmjと花園くらいしかないから消去法でAJ1

ここまで見た
  • 390
  •  
  • 2013/10/19(土) 23:57:56.88
字体差でなく韓国のKS X 1001の発音の違いによって分離されてる字や台湾のBig5の誤って重複収録された字に対応する互換漢字にまで割り当てられたんだな。

ここまで見た
  • 391
  •  
  • 2013/10/20(日) 01:36:27.33
まるで手書きの戸籍簿のようだ

ここまで見た
  • 392
  •  
  • 2013/10/20(日) 08:57:42.32
OS Xって >>96 みたいなことをできるテキストレンダリングAPIが標準でついてるの?
組版ソフトつかっても、フォントに合わせて手動で設定しないといけないことがままあるのに、どうやってやってるのか気になるわ。
これが本当ならmac買いにいく。

ここまで見た
  • 393
  •  
  • 2013/10/20(日) 10:48:41.05
組版ソフトは何を使ってる?

ここまで見た
  • 394
  •  
  • 2013/10/20(日) 21:07:21.25
>>392=>>96か?
それとも基地外が基地外に反応したのか?

ここまで見た
  • 395
  •  
  • 2013/10/21(月) 10:02:49.98
文字コードに対して幅とかマージンが決められてないんだから、スレ違いだろ。
まあ、そもそもフォントとOSで対応できるとか言ったやつが悪いんだけどな。
文字コード的には他のエンコードとの変換のためのコードは使わない。ということは選択肢は1つしかない。
文字コードは文字列の全体的な見た目まで定義してない。仮にmacできれいに表示されたとしてもそれはたまたまってこと。

ここまで見た
  • 396
  •  
  • 2013/10/21(月) 12:37:25.80
互換性を考えない、一人で完結ならそれでもいいんじゃない

ここまで見た
  • 397
  •  
  • 2013/10/22(火) 13:16:40.56
キャラクターとグリフを分けて考えるようになってからややこしくなってきたよな。
「異体字なのか」「同じ字の字形の違い」なのかとかいろいろ

ここまで見た
  • 398
  •  
  • 2013/10/22(火) 16:10:09.10
できる事が増えた。特にUnicodeの異体字は処理が簡単。

ここまで見た
  • 399
  •  
  • 2013/10/22(火) 16:23:09.07
Unicodeの場合、なし崩し的にどんどん包摂の範囲が狭くなっていってるから初期のものとの整合性がぐちゃぐちゃで

ここまで見た
  • 400
  •  
  • 2013/10/22(火) 16:27:12.06
まあその辺は6以降で。

ここまで見た
  • 401
  •  
  • 2013/10/22(火) 17:01:02.23
まあ「文字グリフ分離」はここ数年間での文字コードとフォントの進化の頂点だよな。
あとは包摂の範囲や粒度、字形の問題とか規格で決めることをどう決着つけるのかと
フォントベンダーがちゃんとしたものを手抜きしないで作ってくれるかだよな。

ここまで見た
  • 402
  •  
  • 2013/10/22(火) 17:03:02.82
ユーザー次第だと思うね。
メーカーがちゃんとコスト掛けてるものについて、それをちゃんと評価し、使うかどうか。

ここまで見た
  • 403
  •  
  • 2013/10/22(火) 17:05:46.86
そうだね、凄い手間とお金がかかっているからね。

ここまで見た
  • 404
  •  
  • 2013/10/26(土) 02:43:56.58
フォントのグリフ集合に関してはAJ1の一人勝ちになってるから
その辺Adobe次第なのよね

ここまで見た
  • 405
  •  
  • 2013/10/27(日) 23:12:43.53
>>395
スペースを始めとして、半角、全角や幅ゼロやそれ以外の幅の文字もあるよ
http://ja.wikipedia.org/wiki/Unicode%E6%96%87%E5%AD%97%E3%81%AE%E3%83%9E%E3%83%83%E3%83%94%E3%83%B3%E3%82%B0#.E3.81.9D.E3.81.AE.E4.BB.96.E3.81.AE.E7.89.B9.E6.AE.8A.E7.94.A8.E9.80.94.E6.96.87.E5.AD.97

ここまで見た
  • 406
  •  
  • 2013/10/28(月) 06:01:33.32
よくわからんけど、silフォントみたいなやつ?

ここまで見た
  • 407
  •  
  • 2013/10/29(火) 00:31:26.29
>>405
で、その幅っていうのは具体的にどれだけなんだい?

ここまで見た
  • 408
  •  
  • 2013/10/29(火) 00:36:08.36
等幅フォントを使って
スペース文字で文字間を調節するって
活版印刷みたいだな。

ここまで見た
  • 409
  •  
  • 2013/10/29(火) 07:12:24.68
ところで入札までした変体仮名グリフはどこへ行ったんだ

ここまで見た
  • 410
  •  
  • 2013/10/30(水) 17:42:06.45
いわれてみれば

ここまで見た
  • 411
  •  
  • 2013/10/30(水) 17:49:35.04
ローマ字で長音はサーカムフレックス付けるのに
なんでJISに全角の「サーカムフレックス付O(オー)」が無いんだ?

ここまで見た
  • 412
  •  
  • 2013/10/30(水) 18:39:25.87
そこでいうJISって何?

ここまで見た
  • 413
  • 411
  • 2013/10/30(水) 18:54:48.92
文字集合JIS X 0208のことです。

ここまで見た
  • 414
  • 411
  • 2013/10/30(水) 19:04:54.16
文字コードにそれほど詳しいわけではないのですが
どの日本語文字エンコーディングでも「サーカムフレックス付O(オー)」は保存できません。
そもそも文字集合のなかに無いのでしょうか?

ローマ字も日本語なのに無いのは変だと思うんですよね。
ギリシャ文字やキリル文字はあるのに。

砂時計アラームタイマー
フリックゾンビ
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード