文字コード総合スレ part8 [sc](★0)
-
- 1
- 2012/11/30(金) 13:16:02.46
-
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
-
- 642
- 2014/02/01(土) 18:54:12.12
-
Unicodeでは、丸括弧 (……)・波括弧 {……}・角括弧 [……] にはいわゆる半角のもの(JIS X0201で規定されているもの)のほかに、全角形の(……)・{……}・[……]が規定されています。
括弧の中にいわゆる半角の文字だけがある場合は、いわゆる半角の括弧を用います。
括弧の中にいわゆる全角の文字のうち、漢字・仮名・和文記述記号がある場合は、全角形の括弧を用いるべきだという意見と用いないという意見の2つがありますが、目下の合意はありません。
未了 これについては、当ガイドラインのノートで議論されています。
いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。
直前に、ほかの開き括弧類がある。直後に、句読点やほかの閉じ括弧類が続く。
直前や直後に、和文の句読点や和文の括弧類がある。
括弧が固有名詞や型式番号などの一部で、括弧の前や後を空けずに表記される。
段落の始まりや終わり。
-
- 643
- 2014/02/01(土) 18:54:59.60
-
> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。
なるほど
> いわゆる半角の括弧を用いる場合は、以下の例外を除き、括弧の外側に空白を入れます。
うん、なるほど
-
- 644
- 2014/02/01(土) 18:58:04.76
-
括弧の外側にスペースを入れるのって、
ソフトウェアのUIなんかで「アルファベットと和字の間にスペースを入れる」のとかとも絡んでくるのかな。
-
- 645
- 2014/02/01(土) 19:00:58.26
-
トルツメだな
-
- 646
- 2014/02/01(土) 19:01:58.28
-
>>644
単なる英文の文化だからだろ?
半角英数字 = 英文
全角英数字 = 日本語
半角 = 英文を使うなら、その文化に従えってだけの話。
英語は単語をスペースで区切ります。言い換えると単語の前後にスペースを入れます。
そして括弧の前後にもスペースを入れます。
-
- 647
- 2014/02/01(土) 19:09:28.90
-
>半角英数字 = 英文
ちょっと待て誰が決めた
-
- 648
- 2014/02/01(土) 19:10:57.03
-
やっぱりこの種の話題は宗教戦争化しやすいな。
-
- 649
- 2014/02/01(土) 19:11:51.46
-
>>647
昔から。
そもそもコンピュータの文字なんてのは
最初アルファベットしかなく。
それは日本ではなく、外国(アメリカだっけ?)で
生まれたものなんだよ。
そのアルファベットというのは当然半角で
その文字は英語のために作られた文字。
-
- 650
- 2014/02/01(土) 19:17:49.86
-
ローマ字表記は英文じゃない派
-
- 651
- 2014/02/01(土) 19:20:32.03
-
英文は訂正しよう。
英字
ローマ字も英字
-
- 652
- 2014/02/01(土) 19:22:25.16
-
>>649
いろいろぐちゃぐちゃすぎワラタ
-
- 653
- 2014/02/01(土) 19:24:36.59
-
│
│
J
-
- 654
- 2014/02/01(土) 19:25:19.70
-
>>652
反論はなさそうだねw
-
- 655
- 2014/02/01(土) 19:26:34.88
-
12 月 31 日みたいにいちいち空白入れるとか馬鹿げてるだろ
こんなものは詰めた方が見やすいし
-
- 656
- 2014/02/01(土) 19:26:36.61
-
>>646
jisc6220は英語だったのか
-
- 657
- 2014/02/01(土) 19:29:18.14
-
みんな英字と呼ぶけど、あれはラテン語のものだからラテン語のルールに従うべきだな。
-
- 658
- 2014/02/01(土) 19:29:29.09
-
コイン(10円硬貨など)3枚
とか開始と終了で全半角での挟まれ方が異なる場合でも
矛盾なくできるならローカルルールで使いわけてもいいんだろうがな
-
- 659
- 2014/02/01(土) 19:31:11.58
-
>>657
そして漢字は中国式で、算用数字はインド式を要求されるのだ。なんという悪夢。
-
- 660
- 2014/02/01(土) 19:32:45.80
-
>外国(アメリカだっけ?)
ワラタ
-
- 661
- 2014/02/01(土) 19:33:59.26
-
>>658
やっぱ一概に「こうするのが正しい!」は無理だよなあ。
-
- 662
- 2014/02/01(土) 19:40:59.45
-
なに、インド産のくせにアラビア数字と詐称していたのか ゆるせん
-
- 663
- 2014/02/01(土) 19:43:16.28
-
英でもcharacter(s)みたいな場合にはスペース入れないしねえ。
-
- 664
- 2014/02/01(土) 19:44:42.01
-
>>662
インド産のものがアラビア数字と呼ばれ、
アラビア産のものがインド数字と呼ばれている悲劇
-
- 665
- 2014/02/01(土) 19:47:43.49
-
>>645
?
-
- 666
- 2014/02/01(土) 20:13:29.79
-
最初の質問は、>>630の言うベースラインのズレがUNICODEとかの
規格で決まっているかどうかじゃないの?
リファレンス字形みたいのを示せば一発では。
-
- 667
- 2014/02/01(土) 20:26:16.64
-
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
質問自体はこれだがunicodeなんかにはそのようなものはないと思う
しかし他の規格に無いとは言い切れない悪魔の証明と化すので
そこへは立ち入らない
-
- 668
- 2014/02/01(土) 21:18:56.57
-
なんで同じ字形で全角と半角との2種類の存在が許されてるの?
-
- 669
- 2014/02/01(土) 21:20:38.81
-
は?
-
- 670
- 2014/02/01(土) 21:58:02.58
-
表記の添削希望
http://toro.2ch.net/test/read.cgi/tech/1390104181/
-
- 671
- 622
- 2014/02/02(日) 02:47:48.68
-
>>623
どうも、わたしの近辺では全角括弧が和文用、半角括弧が欧文用としてデファクトスタンダードになっているようです。
>>630
MS ゴシックだとベースライン一緒なんですよね。だからあんまり問題にならなかった。
Windows Vista以降のメイリオとかAndroid他を考えると、文字コード規格や組版規格に従えといっても現実的には無理なんですよね。
あと、全角括弧のベースラインをひらがなや漢字に合わせると、全角英数字のベースラインはどうなるんだっていうところも気になります。
>>633
OSの文字列レンダラに渡すとスペースを入れた方が見栄えがいいけれど、
ワープロソフトで入力すると勝手に前後にアキを入れてくれたりして、なかなか共通にしにくいですね。
>>636
これを言ったら、お前はJIS規格のコードじゃなくて、Unicodeを使っているはずだとか言われました。
あと、昔のfjによくいた、現実を無視したキモイつっこみを入れる奴と一緒だなみたいなことを言われました。
まあ、実際そういう性格に近いですが。
-
- 672
- 2014/02/02(日) 03:24:30.23
-
>>622
> 日本語の文章にいわゆる半角括弧(U+0028,U+0029)を使ったら、全角括弧(U+FF08,U+FF09)を使えと言われました。
> 文字コードに対して、フォントの字形を定義する規格があるのでしょうか。
それがUnicodeだろ
-
- 673
- 2014/02/02(日) 03:38:22.96
-
>>672
字形という言い方が正しくなかったかもしれません。すいません。
ある文字が他のある文字と調和する形状・位置であるかどうかを定義する規格と言ったらいいでしょうか。
-
- 674
- 2014/02/02(日) 04:03:49.23
-
それは言語そのものであって繁体字と簡体字の関係あるいは極論アルファベットが全部同根であるようなもの
-
- 675
- 2014/02/02(日) 04:13:33.39
-
>>671
絶対ルールでなく、あなたのコミュニティーのルールに従うのが良いと思います。
-
- 676
- 2014/02/02(日) 05:00:58.24
-
グリフイメージ(字形)
フォントイメージ(実際に表現されたデザイン)
の話を混同している上に
そもそもどちらも文字コードが扱う問題じゃないんだよな。
-
- 677
- 2014/02/02(日) 05:41:00.57
-
ああ、言っちまったぁ
-
- 678
- 2014/02/02(日) 06:27:00.76
-
文字のないところに文字コードはないとでも言えばわかるのか
-
- 679
- 2014/02/02(日) 08:08:17.34
-
組版については,
「日本語組版処理の要件」
http://www.w3.org/TR/jlreq/ja/
を見たらどうでしょうか。
括弧などの約物処理について詳しく書いてあります
-
- 680
- 2014/02/02(日) 08:52:52.39
-
>>679
クラの編集者に見せたい
-
- 681
- 2014/02/02(日) 09:34:54.11
-
>>676
じゃあ、例示字形ってなんなの?
-
- 682
- 2014/02/02(日) 10:43:50.50
-
> じゃあ、例示字形ってなんなの?
例として示す字形に決まってるじゃん。
^^^^^^^^
絶対これにしろ、と決めるものではない。
-
- 684
- 2014/02/02(日) 15:24:48.86
-
その文章にルールが必要なら決まりに従う、または、決めればいい
入力は誰しも間違うから verifier を用意すること
間違ったからお前が悪いとかあほなことは言わない
-
- 685
- 2014/02/02(日) 16:32:39.69
-
不統一なものを一括処理するスクリプトでも書いておく、と
-
- 686
- 2014/02/03(月) 11:24:18.72
-
ああ、それがいい
-
- 687
- 2014/02/04(火) 00:30:36.47
-
二階建てのaとgの文字コードが欲しいよな。
フォントが指定できない環境で一階建てのaとgとの違いを説明するのに必要だから。
-
- 688
- 2014/02/04(火) 02:03:46.18
-
純粋な字形の説明なんて文字コードの守備範囲外だろう。
それやりだすと「下に棒のある1とない1」「上が閉じている4と開いている4」「横棒が1本の\と2本の\」みたいに収拾がつかなくなるぞ。
-
- 689
- 2014/02/04(火) 05:03:58.19
-
「$」の中の棒を2本にしろとか言われるしorz
-
- 690
- 2014/02/04(火) 06:44:55.07
-
どうしてもプレーンテキストでやりたいなら↓これでどうにかなる
_■■■
____■____■■■
_■■■■___■___■
■___■__■___■
■___■__■___■
_■■■____■■■_■
-
- 691
- 2014/02/04(火) 07:14:45.36
-
そもそも、JIS X 0208で英数記号をISO 646と重複符号化したことが問題。
便宜上全角・半角と呼ばれて字形を区別しているフォントが多いが、本来は全角・半角なんて概念は文字コード自体に存在しない。
このページを共有する
おすすめワード