facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 658
  •  
  • 2014/02/01(土) 19:29:29.09
コイン(10円硬貨など)3枚

とか開始と終了で全半角での挟まれ方が異なる場合でも
矛盾なくできるならローカルルールで使いわけてもいいんだろうがな

ここまで見た
  • 659
  •  
  • 2014/02/01(土) 19:31:11.58
>>657
そして漢字は中国式で、算用数字はインド式を要求されるのだ。なんという悪夢。

ここまで見た
  • 660
  •  
  • 2014/02/01(土) 19:32:45.80
>外国(アメリカだっけ?)

ワラタ

ここまで見た
  • 661
  •  
  • 2014/02/01(土) 19:33:59.26
>>658
やっぱ一概に「こうするのが正しい!」は無理だよなあ。

ここまで見た
  • 662
  •  
  • 2014/02/01(土) 19:40:59.45
なに、インド産のくせにアラビア数字と詐称していたのか ゆるせん

ここまで見た
  • 663
  •  
  • 2014/02/01(土) 19:43:16.28
英でもcharacter(s)みたいな場合にはスペース入れないしねえ。

ここまで見た
  • 664
  •  
  • 2014/02/01(土) 19:44:42.01
>>662
インド産のものがアラビア数字と呼ばれ、
アラビア産のものがインド数字と呼ばれている悲劇

ここまで見た
  • 665
  •  
  • 2014/02/01(土) 19:47:43.49
>>645
?

ここまで見た
  • 666
  •  
  • 2014/02/01(土) 20:13:29.79
最初の質問は、>>630の言うベースラインのズレがUNICODEとかの
規格で決まっているかどうかじゃないの?
リファレンス字形みたいのを示せば一発では。

ここまで見た
  • 667
  •  
  • 2014/02/01(土) 20:26:16.64
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

質問自体はこれだがunicodeなんかにはそのようなものはないと思う
しかし他の規格に無いとは言い切れない悪魔の証明と化すので
そこへは立ち入らない

ここまで見た
  • 668
  •  
  • 2014/02/01(土) 21:18:56.57
なんで同じ字形で全角と半角との2種類の存在が許されてるの?

ここまで見た
  • 669
  •  
  • 2014/02/01(土) 21:20:38.81
は?

ここまで見た
  • 670
  •  
  • 2014/02/01(土) 21:58:02.58
表記の添削希望
http://toro.2ch.net/test/read.cgi/tech/1390104181/

ここまで見た
  • 671
  • 622
  • 2014/02/02(日) 02:47:48.68
>>623
どうも、わたしの近辺では全角括弧が和文用、半角括弧が欧文用としてデファクトスタンダードになっているようです。
>>630
MS ゴシックだとベースライン一緒なんですよね。だからあんまり問題にならなかった。
Windows Vista以降のメイリオとかAndroid他を考えると、文字コード規格や組版規格に従えといっても現実的には無理なんですよね。
あと、全角括弧のベースラインをひらがなや漢字に合わせると、全角英数字のベースラインはどうなるんだっていうところも気になります。
>>633
OSの文字列レンダラに渡すとスペースを入れた方が見栄えがいいけれど、
ワープロソフトで入力すると勝手に前後にアキを入れてくれたりして、なかなか共通にしにくいですね。
>>636
これを言ったら、お前はJIS規格のコードじゃなくて、Unicodeを使っているはずだとか言われました。
あと、昔のfjによくいた、現実を無視したキモイつっこみを入れる奴と一緒だなみたいなことを言われました。
まあ、実際そういう性格に近いですが。

ここまで見た
  • 672
  •  
  • 2014/02/02(日) 03:24:30.23
>>622
> 日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
それがUnicodeだろ

ここまで見た
  • 673
  •  
  • 2014/02/02(日) 03:38:22.96
>>672
字形という言い方が正しくなかったかもしれません。すいません。
ある文字が他のある文字と調和する形状・位置であるかどうかを定義する規格と言ったらいいでしょうか。

ここまで見た
  • 674
  •  
  • 2014/02/02(日) 04:03:49.23
それは言語そのものであって繁体字と簡体字の関係あるいは極論アルファベットが全部同根であるようなもの

ここまで見た
  • 675
  •  
  • 2014/02/02(日) 04:13:33.39
>>671
絶対ルールでなく、あなたのコミュニティーのルールに従うのが良いと思います。

ここまで見た
  • 676
  •  
  • 2014/02/02(日) 05:00:58.24
グリフイメージ(字形)
フォントイメージ(実際に表現されたデザイン)
の話を混同している上に
そもそもどちらも文字コードが扱う問題じゃないんだよな。

ここまで見た
  • 677
  •  
  • 2014/02/02(日) 05:41:00.57
ああ、言っちまったぁ

ここまで見た
  • 678
  •  
  • 2014/02/02(日) 06:27:00.76
文字のないところに文字コードはないとでも言えばわかるのか

ここまで見た
  • 679
  •  
  • 2014/02/02(日) 08:08:17.34
組版については,
「日本語組版処理の要件」
http://www.w3.org/TR/jlreq/ja/
を見たらどうでしょうか。
括弧などの約物処理について詳しく書いてあります

ここまで見た
  • 680
  •  
  • 2014/02/02(日) 08:52:52.39
>>679
クラの編集者に見せたい

ここまで見た
  • 681
  •  
  • 2014/02/02(日) 09:34:54.11
>>676
じゃあ、例示字形ってなんなの?

ここまで見た
  • 682
  •  
  • 2014/02/02(日) 10:43:50.50
> じゃあ、例示字形ってなんなの?
例として示す字形に決まってるじゃん。
^^^^^^^^
絶対これにしろ、と決めるものではない。

ここまで見た
  • 683
  •  
  • 2014/02/02(日) 14:36:33.41
>>679
それの元が>>636のJISX4051で結果が>>671なんだし無駄なことだろ

ここまで見た
  • 684
  •  
  • 2014/02/02(日) 15:24:48.86
その文章にルールが必要なら決まりに従う、または、決めればいい
入力は誰しも間違うから verifier を用意すること
間違ったからお前が悪いとかあほなことは言わない

ここまで見た
  • 685
  •  
  • 2014/02/02(日) 16:32:39.69
不統一なものを一括処理するスクリプトでも書いておく、と

ここまで見た
  • 686
  •  
  • 2014/02/03(月) 11:24:18.72
ああ、それがいい

ここまで見た
  • 687
  •  
  • 2014/02/04(火) 00:30:36.47
二階建てのaとgの文字コードが欲しいよな。
フォントが指定できない環境で一階建てのaとgとの違いを説明するのに必要だから。

ここまで見た
  • 688
  •  
  • 2014/02/04(火) 02:03:46.18
純粋な字形の説明なんて文字コードの守備範囲外だろう。
それやりだすと「下に棒のある1とない1」「上が閉じている4と開いている4」「横棒が1本の\と2本の\」みたいに収拾がつかなくなるぞ。

ここまで見た
  • 689
  •  
  • 2014/02/04(火) 05:03:58.19
「$」の中の棒を2本にしろとか言われるしorz

ここまで見た
  • 690
  •  
  • 2014/02/04(火) 06:44:55.07
どうしてもプレーンテキストでやりたいなら↓これでどうにかなる

_■■■
____■____■■■
_■■■■___■___■
■___■__■___■
■___■__■___■
_■■■____■■■_■

ここまで見た
  • 691
  •  
  • 2014/02/04(火) 07:14:45.36
そもそも、JIS X 0208で英数記号をISO 646と重複符号化したことが問題。
便宜上全角・半角と呼ばれて字形を区別しているフォントが多いが、本来は全角・半角なんて概念は文字コード自体に存在しない。

ここまで見た
  • 692
  •  
  • 2014/02/04(火) 08:20:17.20
半角2バイト文字とか、いや〜ん

ここまで見た
  • 693
  •  
  • 2014/02/04(火) 10:23:20.18
流石にそれは98機種依存だけどなw

ここまで見た
  • 694
  •  
  • 2014/02/04(火) 21:31:34.29
>>625
つ mathモードのカッコを好みのサイズに引き伸ばして使う派

ここまで見た
  • 695
  •  
  • 2014/02/04(火) 21:32:40.85
>>628
(applicationが好き)だとどうなるのだろうか?

ここまで見た
  • 696
  •  
  • 2014/02/04(火) 21:37:40.51
>>691
けどomicronとかEPWINGみたいな使い方を想定したんでしょ?

ここまで見た
  • 697
  •  
  • 2014/02/04(火) 21:45:07.81
一応一階建てのaとgはU+0251とU+0261に符号化されてる。
発音記号用に符号化されてる(特にaについては一階建てか二階建てかで別の発音を表す)がそれ以外の字形の説明等の用途に使ってもいい筈。
でも二階建て専用コードは無いんだな。活字系のフォントではU+0061とU+0067は二階建てであることが多いが。
一部のフォントでは一階建てになってしまうから、厳密に二階建てであることを示さなければいけないときの為に符号化してほしいよな。
VSを使ってU+0061 U+FE00,U+0067 U+FE00とかでもいいから。

ここまで見た
  • 698
  •  
  • 2014/02/04(火) 21:51:42.38
二階建てa用のコードポイントがなくても発音記号用途は現状うまくまわってるの?

ここまで見た
  • 699
  •  
  • 2014/02/05(水) 00:12:17.20
「そ」の上が「ソ」と「フ」どっちなのか「き」「さ」「り」繋がっているかとかは割と話題に上るが
「え」「ん」の「〜」部分の山は角なのか丸なのか直前の斜線と一部同化するのか
「ね」「れ」「わ」の「フ」が「|」にかかるのかあたりはあまり聞かないな
漢字だったらさぞ大騒ぎすることだろう

ここまで見た
  • 700
  •  
  • 2014/02/05(水) 01:27:02.52
固有名詞が平仮名で字形が厳密に決められてる例というと、「さいたま」の「さ」(繋がってる字形)ぐらいか。
でも離した字形使って間違ってるから直せと言われたとか怒る人がいるという話しは聞いた事が無い。

ここまで見た
  • 701
  •  
  • 2014/02/05(水) 01:39:48.97
明朝体だと「お」の左下とか「や」の右上も気になる

ここまで見た
  • 702
  •  
  • 2014/02/05(水) 03:17:13.10
>>695
成り行きの改行で閉じの丸括弧を行頭に来させたくないなら、全角で。

ここまで見た
  • 703
  •  
  • 2014/02/05(水) 03:28:33.08
コード表で Unicode ラテン1補助(aとeがくっついてるの<00E6>があるあたり)見てるんだけど、
こんなところに"×"が入ってるんだな。だから○×と並べるの×が小さく見えるの? 関係ない?

ここまで見た
  • 704
  •  
  • 2014/02/05(水) 03:38:53.22
バツではなく掛け算記号だからしょうがない

ここまで見た
  • 705
  •  
  • 2014/02/05(水) 03:49:32.08
まあね。テヘッ

ここまで見た
  • 706
  •  
  • 2014/02/05(水) 14:07:24.00
×✕✖

ここまで見た
  • 707
  •  
  • 2014/02/05(水) 16:23:52.95
脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

ここまで見た
  • 708
  •  
  • 2014/02/06(木) 01:22:07.85
このサイトの文字コードはほんと悩まされた、何でこんな珍しい文字コード使ってるのかってのない?
基本はShift-jis,euc-jp,utf-8で終わってしまうけど

ここまで見た
  • 709
  •  
  • 2014/02/06(木) 01:56:44.96
昔、x-macjapaneseを見た記憶がある。
もうないと思うけど。

お絵かきランド
フリックゾンビ
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード