文字コード総合スレ part8 [sc](★0)
-
- 1
- 2012/11/30(金) 13:16:02.46
-
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
-
- 222
- 2013/04/10(水) 12:13:56.89
-
>>219
そうか?繁体字と簡体字くらいの違いはあるかも知れんぞ
-
- 223
- 2013/04/12(金) 15:20:03.40
-
なんかそういうのあったな。
ダイアクリティカルマークだったか合字だったか忘れたけど、
コードポイントは同じでも国によって微妙なデザインを使い分けないと現地民にプギャられるってやつ。
-
- 224
- 2013/04/12(金) 21:42:52.95
-
ちょっと点の向きや形が違うと言って大騒ぎ。
しまいにゃ文字幅がどうこう言い出す始末。
そんな現地民が東アジア方面にいるとかいないとか
-
- 225
- 2013/04/12(金) 22:15:53.06
-
ピンインの二声・四声の話かな?
どれぐらい現地民が気にしてるのかわからないけど。
-
- 226
- 2013/04/13(土) 02:20:28.57
-
その国には "立" の一画目が横か縦かを真面目な学問として
研究して金をもらっている連中もいるらしい
-
- 227
- 2013/04/13(土) 03:44:23.55
-
あまり面白い皮肉じゃないな
-
- 228
- 2013/04/13(土) 23:10:53.74
-
研究してる奴らって立たなくなった奴ばっかりなんだろ
-
- 229
- 2013/04/15(月) 12:09:40.57
-
>>226
「龍」の方がおもしろいな
-
- 230
- 2013/04/15(月) 21:27:01.56
-
「正しい字形」は横なのに縦で教えるダブスタ大杉
-
- 231
- 2013/04/15(月) 23:43:58.32
-
>>208
iconv
-
- 232
- 2013/04/16(火) 04:06:42.93
-
>>209
>UTF-16なんて必要ないな
InDesignというDTPソフトにunicodeテキストを配置する場合、
UTF-16BEなんてもんにしなくちゃいけないんざますの。
-
- 234
- 2013/04/16(火) 06:20:11.15
-
要るんです、という話をしただけですのよ。ちなみにわたくしエディタで変換してますわ。
-
- 235
- 2013/04/28(日) 14:29:25.02
-
そして誰も
-
- 236
- 2013/04/29(月) 22:33:06.77
-
今はもう
-
- 237
- 2013/04/30(火) 03:22:01.47
-
初夏
-
- 238
- 2013/05/01(水) 15:50:42.12
-
5月か
早いな
-
- 239
- 2013/05/01(水) 23:51:25.22
-
アレってどうなったんだっけ
-
- 240
- 2013/05/03(金) 22:41:27.92
-
ドレ?
-
- 241
- 2013/05/03(金) 23:27:41.29
-
何のヿ?
-
- 242
- 2013/05/04(土) 19:08:59.48
-
コト点でないのか
-
- 243
- 2013/05/05(日) 00:20:52.26
-
BBS_UNICODE=passは万能ではないってこと?
-
- 244
- 2013/05/05(日) 00:47:04.03
-
てすと ヿ
-
- 245
- 2013/05/05(日) 11:06:17.17
-
数値参照だと出るの?ヿ
-
- 246
- 2013/05/05(日) 13:44:32.35
-
241は & が変換されてる
-
- 247
- 2013/05/05(日) 17:19:43.57
-
テスト
ヿ
-
- 248
- 2013/05/05(日) 17:20:33.68
-
変換されるなあ
-
- 249
- 2013/05/10(金) 02:10:52.50
-
Open2chの文字コードは、UTF-8だ
<html lang="ja">
<head>
<title>宝くじ@open2ch掲示板</title><style>body{ margin:0; padding:0;}</style>
<link rel="alternate" type="application/rss+xml" title="RSS" href="http://http://engawa.open2ch.net/loto/index.rdf" />
<link rel="alternate" type="application/atom+xml" title="Atom" href="http://http://engawa.open2ch.net/loto/atom.xml" />
<script type="text/javascript" src="/lib/jquery/jquery-1.7.2.min.js"></script>
<script type="text/javascript" src="/lib/common.js?v2"></script>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link href="/lib/main.css?x" type="text/css" rel="stylesheet" />
</head><body text=#000000 link=#0000FF alink=#FF0000 vlink=#660099 background=/image/ba.gif>
-
- 250
- 2013/05/12(日) 00:29:20.32
-
Old Hungarianは泥沼だな…
-
- 251
- 2013/05/12(日) 15:25:57.78
-
よく知らない人でもわかるように簡単な解説希望
-
- 252
- 2013/05/12(日) 23:40:04.51
-
Eversonが昔出した提案を前進させようとしたらハンガリー国内よりカウンター提案が
出てきた
そっちは稚拙だったのでEversonペースで進みかけたけど、カウンター提案者が
ハンガリーNBの座を獲得したので意向を無視できなくなった
以後ハンガリー国内で支持が割れて、この度ハンガリー国内から「今のEversonベースの
符号化案のまま行ってくれ」という署名リスト(N4420)と、「今の符号化案を投票から
外せ」という署名リスト(N4422)が届いた
-
- 253
- 2013/05/12(日) 23:53:19.67
-
おっおおう…頭抱えたくなる状況だな
-
- 254
- 2013/05/13(月) 12:17:49.20
-
なんか難しい話だな。
n4368(Everson)とn4367の戦いってことみたいだけど、
一例にdzの話を読むと、(梯子zの横に棒がついた文字)
これはもともとold hungerianになかった音/文字で、
n4368は現代では使わないから必要ないって立場(n4368 1.2)
n4367はこれは単なるd+zじゃないんだよ(n4367 5.4.1)
読み込めてないけど、
n4368は現代ハンガリー語に対応する正書法の提案も含まれていて、
n4367は歴史的な経緯を踏まえた提案になっている感じか。
たぶんold hungerianを、現代に復活させようとしている派(n4368)と、
歴史的な文字として登録しようとしている派(n4367)の戦いじゃないか。
n4420の"everyday use"とか、n4368 1.2の後半読むと。
学校でold hungerianを使わせる計画があるみたいだ。
-
- 255
- 2013/05/13(月) 13:54:42.87
-
こういうのっていろんな分野で政治行政と歩調を合わせないといけないからほんと難しいよね。
単に自分(規格がらみ)が各方面と一対一で調整するだけじゃなくて、そいつら同士の橋渡しまで面倒見ないと何もまとまらないし。
-
- 256
- 2013/05/13(月) 17:37:20.80
-
254です。
2,3時間読んでみただけで言うのも無責任だけど、
n4367の方がよさそうな気がするなあ。
Everson版は目的を限定しすぎてて、文字数も相当少ない。
かと言って合字が定義されてるわけでもない。
最初に網羅的にやっとかないと後で公開することになるはず。
あと、n4422によれば間違いも多いと書かれている。
実際どうか検証する知識はないけど、
n4367の方が引用している資料も多いし、一文字に対する検証も徹底的。
Eversonさんは膨大なスクリプトについてUnicodeに多大な貢献があるのは事実だけど、
専門家の意見も謙虚に聴くべきではないか?
まあUnicode専門家の意見も尊重しないといけないがね。
-
- 257
- 2013/05/13(月) 22:34:08.76
-
>最初に網羅的にやっとかないと
日本人が言うとすごい説得力あるよねこれ
-
- 258
- 2013/05/24(金) 01:09:40.80
-
Character encoding poetry
ttps://www.facebook.com/cmb/posts/619241744770551
-
- 259
- 2013/05/24(金) 11:45:41.18
-
>>252は勘違いで、Everson案がUnicode的稚拙さで、
専門家が本格的な改正案を出してきたってところみたいだな。
-
- 260
- 2013/06/01(土) 11:09:43.05
-
そういうものなのかね
-
- 261
- 2013/06/24(月) 03:10:36.60
-
過疎ってるな
-
- 262
- 2013/06/24(月) 06:46:38.91
-
ねたが無いからね
-
- 263
- 2013/06/24(月) 15:04:34.93
-
坂村健みたいな逸材が必要とされている
-
- 264
- 2013/06/27(木) 16:58:52.16
-
http://d.hatena.ne.jp/akane_neko/20130621/1371766405
これ読む限りだと安岡センセイもネタ切れなのかと
-
- 265
- 2013/06/29(土) 23:43:50.69
-
安岡は基地外だから もう引退した方がいい
-
- 266
- 2013/06/30(日) 02:05:47.38
-
最近のWG2の文書の中だとcedillaと下付commaの件が面白いな
結局下付commaの方は別途符号化することになったようだけど
-
- 268
-
さて
-
- 269
-
来週の
-
- 270
-
キテレツ大百科は
-
- 271
-
ツレテキ
-
- 272
-
スレが凍りついているわけだが
-
- 273
-
unicodeの歴史について勉強しようと思ったら初めからいきなり2バイト固定にしようとしていてズっこけた。
当時日本人はだれも突っ込まなかったんだろうか
あるいは当時のマシンスペックとの妥協とか政治的な何かとか理由があった?
このページを共有する
おすすめワード