文字コード総合スレ part8 [sc] | レス667-718 | 2ch過去ログ

★お気に入り追加

■ このスレッドは過去ログ倉庫に格納されています

1 2012/11/30(金) 13:16:02.46

プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
（スレ再利用）UnicodeとUTF-8の違いは？ http://pc12.2ch.net/test/read.cgi/tech/1177930957/
（隔離スレ）UnicodeとUTF-8の違いは？　その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

フリックゾンビ

フリック回転寿司

ここまで見た

667 2014/02/01(土) 20:26:16.64: > 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。

質問自体はこれだがunicodeなんかにはそのようなものはないと思う
しかし他の規格に無いとは言い切れない悪魔の証明と化すので
そこへは立ち入らない

ここまで見た

668 2014/02/01(土) 21:18:56.57: なんで同じ字形で全角と半角との２種類の存在が許されてるの？

ここまで見た

669 2014/02/01(土) 21:20:38.81: は？

ここまで見た

670 2014/02/01(土) 21:58:02.58: 表記の添削希望
http://toro.2ch.net/test/read.cgi/tech/1390104181/

ここまで見た

671

622

2014/02/02(日) 02:47:48.68: >>623
どうも、わたしの近辺では全角括弧が和文用、半角括弧が欧文用としてデファクトスタンダードになっているようです。
>>630
MS ゴシックだとベースライン一緒なんですよね。だからあんまり問題にならなかった。
Windows Vista以降のメイリオとかAndroid他を考えると、文字コード規格や組版規格に従えといっても現実的には無理なんですよね。
あと、全角括弧のベースラインをひらがなや漢字に合わせると、全角英数字のベースラインはどうなるんだっていうところも気になります。
>>633
OSの文字列レンダラに渡すとスペースを入れた方が見栄えがいいけれど、
ワープロソフトで入力すると勝手に前後にアキを入れてくれたりして、なかなか共通にしにくいですね。
>>636
これを言ったら、お前はJIS規格のコードじゃなくて、Unicodeを使っているはずだとか言われました。
あと、昔のfjによくいた、現実を無視したキモイつっこみを入れる奴と一緒だなみたいなことを言われました。
まあ、実際そういう性格に近いですが。

ここまで見た

672 2014/02/02(日) 03:24:30.23: >>622
> 日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
それがUnicodeだろ

ここまで見た

673 2014/02/02(日) 03:38:22.96: >>672
字形という言い方が正しくなかったかもしれません。すいません。
ある文字が他のある文字と調和する形状・位置であるかどうかを定義する規格と言ったらいいでしょうか。

ここまで見た

674 2014/02/02(日) 04:03:49.23: それは言語そのものであって繁体字と簡体字の関係あるいは極論アルファベットが全部同根であるようなもの

ここまで見た

675 2014/02/02(日) 04:13:33.39: >>671
絶対ルールでなく、あなたのコミュニティーのルールに従うのが良いと思います。

ここまで見た

676 2014/02/02(日) 05:00:58.24: グリフイメージ（字形）
フォントイメージ（実際に表現されたデザイン）
の話を混同している上に
そもそもどちらも文字コードが扱う問題じゃないんだよな。

ここまで見た

677 2014/02/02(日) 05:41:00.57: ああ、言っちまったぁ

ここまで見た

678 2014/02/02(日) 06:27:00.76: 文字のないところに文字コードはないとでも言えばわかるのか

ここまで見た

679 2014/02/02(日) 08:08:17.34: 組版については，
「日本語組版処理の要件」
http://www.w3.org/TR/jlreq/ja/
を見たらどうでしょうか。
括弧などの約物処理について詳しく書いてあります

ここまで見た

680 2014/02/02(日) 08:52:52.39: >>679
クラの編集者に見せたい

ここまで見た

681 2014/02/02(日) 09:34:54.11: >>676
じゃあ、例示字形ってなんなの？

ここまで見た

682 2014/02/02(日) 10:43:50.50: > じゃあ、例示字形ってなんなの？
例として示す字形に決まってるじゃん。
^^^^^^^^
絶対これにしろ、と決めるものではない。

ここまで見た

683 2014/02/02(日) 14:36:33.41: >>679
それの元が>>636のJISX4051で結果が>>671なんだし無駄なことだろ

ここまで見た

684 2014/02/02(日) 15:24:48.86: その文章にルールが必要なら決まりに従う、または、決めればいい
入力は誰しも間違うから verifier を用意すること
間違ったからお前が悪いとかあほなことは言わない

ここまで見た

685 2014/02/02(日) 16:32:39.69: 不統一なものを一括処理するスクリプトでも書いておく、と

ここまで見た

686 2014/02/03(月) 11:24:18.72: ああ、それがいい

ここまで見た

687 2014/02/04(火) 00:30:36.47: 二階建てのaとgの文字コードが欲しいよな。
フォントが指定できない環境で一階建てのaとgとの違いを説明するのに必要だから。

ここまで見た

688 2014/02/04(火) 02:03:46.18: 純粋な字形の説明なんて文字コードの守備範囲外だろう。
それやりだすと「下に棒のある1とない1」「上が閉じている4と開いている4」「横棒が1本の\と2本の\」みたいに収拾がつかなくなるぞ。

ここまで見た

689 2014/02/04(火) 05:03:58.19: 「$」の中の棒を２本にしろとか言われるしorz

ここまで見た

690 2014/02/04(火) 06:44:55.07: どうしてもプレーンテキストでやりたいなら↓これでどうにかなる

＿■■■
＿＿＿＿■＿＿＿＿■■■
＿■■■■＿＿＿■＿＿＿■
■＿＿＿■＿＿■＿＿＿■
■＿＿＿■＿＿■＿＿＿■
＿■■■＿＿＿＿■■■＿■

ここまで見た

691 2014/02/04(火) 07:14:45.36: そもそも、JIS X 0208で英数記号をISO 646と重複符号化したことが問題。
便宜上全角・半角と呼ばれて字形を区別しているフォントが多いが、本来は全角・半角なんて概念は文字コード自体に存在しない。

ここまで見た

692 2014/02/04(火) 08:20:17.20: 半角２バイト文字とか、いや〜ん

ここまで見た

693 2014/02/04(火) 10:23:20.18: 流石にそれは98機種依存だけどなw

ここまで見た

694 2014/02/04(火) 21:31:34.29: >>625
つ mathモードのカッコを好みのサイズに引き伸ばして使う派

ここまで見た

695 2014/02/04(火) 21:32:40.85: >>628
(applicationが好き)だとどうなるのだろうか?

ここまで見た

696 2014/02/04(火) 21:37:40.51: >>691
けどomicronとかEPWINGみたいな使い方を想定したんでしょ?

ここまで見た

697 2014/02/04(火) 21:45:07.81: 一応一階建てのaとgはU+0251とU+0261に符号化されてる。
発音記号用に符号化されてる(特にaについては一階建てか二階建てかで別の発音を表す)がそれ以外の字形の説明等の用途に使ってもいい筈。
でも二階建て専用コードは無いんだな。活字系のフォントではU+0061とU+0067は二階建てであることが多いが。
一部のフォントでは一階建てになってしまうから、厳密に二階建てであることを示さなければいけないときの為に符号化してほしいよな。
VSを使ってU+0061 U+FE00,U+0067 U+FE00とかでもいいから。

ここまで見た

698 2014/02/04(火) 21:51:42.38: 二階建てa用のコードポイントがなくても発音記号用途は現状うまくまわってるの？

ここまで見た

699 2014/02/05(水) 00:12:17.20: 「そ」の上が「ソ」と「フ」どっちなのか「き」「さ」「り」繋がっているかとかは割と話題に上るが
「え」「ん」の「〜」部分の山は角なのか丸なのか直前の斜線と一部同化するのか
「ね」「れ」「わ」の「フ」が「｜」にかかるのかあたりはあまり聞かないな
漢字だったらさぞ大騒ぎすることだろう

ここまで見た

700 2014/02/05(水) 01:27:02.52: 固有名詞が平仮名で字形が厳密に決められてる例というと、「さいたま」の「さ」（繋がってる字形）ぐらいか。
でも離した字形使って間違ってるから直せと言われたとか怒る人がいるという話しは聞いた事が無い。

ここまで見た

701 2014/02/05(水) 01:39:48.97: 明朝体だと「お」の左下とか「や」の右上も気になる

ここまで見た

702 2014/02/05(水) 03:17:13.10: >>695
成り行きの改行で閉じの丸括弧を行頭に来させたくないなら、全角で。

ここまで見た

703 2014/02/05(水) 03:28:33.08: コード表で Unicode ラテン1補助（aとeがくっついてるの<00E6>があるあたり）見てるんだけど、
こんなところに"×"が入ってるんだな。だから○×と並べるの×が小さく見えるの？　関係ない？

ここまで見た

704 2014/02/05(水) 03:38:53.22: バツではなく掛け算記号だからしょうがない

ここまで見た

705 2014/02/05(水) 03:49:32.08: まあね。ﾃﾍｯ

ここまで見た

706 2014/02/05(水) 14:07:24.00: ×✕✖

ここまで見た

707 2014/02/05(水) 16:23:52.95: 脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

脱法ハーフスナック報道車

ここまで見た

708 2014/02/06(木) 01:22:07.85: このサイトの文字コードはほんと悩まされた、何でこんな珍しい文字コード使ってるのかってのない？
基本はShift-jis,euc-jp,utf-8で終わってしまうけど

ここまで見た

709 2014/02/06(木) 01:56:44.96: 昔、x-macjapaneseを見た記憶がある。
もうないと思うけど。

ここまで見た

710 2014/02/06(木) 04:16:23.05: エディタのエンコーディングリストに
「無損失ASCII（Non-lossy ASCII）」ってのがあるんだけど、これなんだろう。

ここまで見た

711 2014/02/06(木) 06:59:18.67: >>696
規格票読む限りはその意図はない。
JIS X 0208はJIS X 0201のスーパーセットを作ろうとしただけのはず。

ここまで見た

712 2014/02/06(木) 08:03:16.72: >>711=アスペ

X 0201のAとX 0208のＡが重複してるだろ。

ここまで見た

713 2014/02/06(木) 09:48:29.41: 認定厨死ね。

重複は問題じゃない。

確か、ほんとうはちゃんとスーパーセットにするつもりだったのに、
結局スーパーセットになってないのが問題。

ここまで見た

714 2014/02/06(木) 10:21:37.55: >>708
2chがいまだにutf8化せずにcp932なのがアレ

ここまで見た

715 2014/02/06(木) 13:48:22.87: 他スレに質問したのですが、このスレ見つけたので移動してきました

[\u3000-\u9fff]とは何を意味しているのでしょうか?
u3000はユニコードの全角空白のようですが、
u9fffは分かりません
おそらくユニコードによる漢字の最後の文字じゃないかと思うのですが

ここまで見た

716 2014/02/06(木) 15:10:55.51: CJK統合漢字
http://ja.wikipedia.org/wiki/CJK統合漢字

ここまで見た

717 2014/02/06(木) 21:28:49.97: >>711
スーパーセットつくろうとしたなら、
JIS X 0208を単独で使う意図があったんじゃないの?
実際使われていたし。

ここまで見た

718 2014/02/06(木) 21:40:05.37

mohta氏はそのように運用してはいたけど...

フリックラーニング

フリック回転寿司

ここまで見た

★お気に入り追加

このページを共有する

おすすめワード

スレッドランキング

1位島田洋七が松本人志復帰説を一蹴…「視聴者は笑えない」「“天才...(198)
2024-11-14 21:39 [sc] 2位「＃さよなら俺たちの松ちゃん」松本人志　訴訟取り下げで見限...(176)
2024-11-14 21:33 [sc] 3位辛坊治郎氏、外食で感じたニッポンの危機「何も乗ってない蕎麦...(170)
2024-11-14 21:11 [sc] 4位【テレビ】BPO　衆院選特番の「裏金」表記、サッカーJ1町田へ...(53)
2024-11-14 20:35 [sc] 5位【サッカー】オーストラリアとサウジアラビアの“直接対決”はス...(141)
2024-11-14 20:34 [sc]

6位【野球】26年WBC予選は台湾と米国で開催　前回Vの日本など16チ...(75)
2024-11-14 20:20 [sc] 7位【NBA】八村塁　男子バスケ日本代表への偽らざる思いを吐露「...(849)
2024-11-14 19:08 [sc] 8位「＃さよなら俺たちの松ちゃん」松本人志　訴訟取り下げで見限...(1001)
2024-11-14 19:04 [sc] 9位【野球】西武、FAの大山悠輔と原口文仁のW獲りを画策　後藤オ...(211)
2024-11-14 18:28 [sc] 10位【サッカー】三笘薫がインドネシアの〝最恐アウェー&#12...(79)
2024-11-14 17:56 [sc]

同一板（プログラム板）のスレッドリスト

高2の授業でアプリを作るんや。案を募集するやで(26)
2024-11-06 06:43 [sc] 【PHP】下らねぇ質問はここに書き込みやがれ 15(32)
2024-10-29 20:52 [sc] AIの執筆した記事(13)
2024-10-10 08:50 [sc] 個人開発者の雑談スレ(23)
2024-10-02 05:56 [sc] プログラミングに詳しくて辛抱強い人来て(34)
2024-09-30 21:47 [sc]

Pythonのお勉強 Part74(320)
2024-09-21 10:14 [sc] Rust part26(800)
2024-09-20 22:18 [sc] DoS攻撃ツール作ろうぜ(26)
2024-09-09 11:53 [sc] 【まず1嫁】くだすれPython(超初心者用) その60(80)
2024-09-01 19:58 [sc] WPF(.NET, WinUI) GUIプログラミング Part33(323)
2024-08-20 21:16 [sc]

おすすめスレッド[科学ニュース+板]

【解説】1発で地球を破壊する核爆弾を作る狂気の「サンダイヤ...(33)
2024-11-13 23:19 [sc] 【AI】OpenAIはAIの進化の頭打ちで戦略の転換を余儀なくされて...(46)
2024-11-13 23:16 [sc] 【AI】生成AIツールで画像や実験データを簡単に捏造できるよう...(11)
2024-11-13 23:15 [sc] 【ナゾロジー】脳に磁場をかけて「うつ病」を5日で改善！自宅...(65)
2024-11-13 23:14 [sc] 【ナゾロジー】植物は耐性ステを上げすぎると成長にデバフを受...(11)
2024-11-13 23:08 [sc]

【鳥】カラスは“恨みつらみ”を17年間記憶していた！06年からの...(19)
2024-11-13 23:00 [sc] 【昆虫】アスファルト上で死ぬカマキリ、寄生虫に操られていた...(15)
2024-11-13 22:58 [sc] 【生物】ミトコンドリアは単なる細胞小器官ではなく「生命」だ...(12)
2024-11-12 23:17 [sc] 【ナゾロジー】あなたはどれ？ Wikipediaユーザーに見られる「...(34)
2024-11-12 23:16 [sc] 【電池】リチウムイオン電池がよみがえる　負極の再利用手法を...(23)
2024-11-12 23:15 [sc]

速報スレッド

女課長「あげるわあなたに」←残業中もらったらうれしいもの(14)
2024-11-14 22:32 [sc] 【画像】家系ラーメン「アメリカに出店したいけど名前どうしよ...(16)
2024-11-14 22:26 [sc] お前ら女芸人で笑った事ある|_-))))?(11)
2024-11-14 22:24 [sc] 妹が私をオカズにすんなみたいに俺を嫌ってたんだが(10)
2024-11-14 22:24 [sc] コナン「カリッ・・・これは青酸ペロ！」←昔のネラーはこんな...(11)
2024-11-14 22:23 [sc]

お前らタメ口やめてくれ(10)
2024-11-14 22:21 [sc] Vチューバーさん「3ヶ月休止していました」リスナー「どうせ休...(17)
2024-11-14 22:20 [sc] かさのぼん来て！(15)
2024-11-14 22:19 [sc] (*´ω｀*)かかってこいよ困り眉!銃なんか捨ててかかってこい…怖...(10)
2024-11-14 22:19 [sc] シンママって性欲強い人多くないか？(11)
2024-11-14 22:19 [sc]