facebook twitter hatena line google mixi email
★お気に入り追加


■ このスレッドは過去ログ倉庫に格納されています

  • 1
  •  
  • 2012/11/30(金) 13:16:02.46
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

ここまで見た
  • 241
  •  
  • 2013/05/03(金) 23:27:41.29
何のヿ?

ここまで見た
  • 242
  •  
  • 2013/05/04(土) 19:08:59.48
コト点でないのか

ここまで見た
  • 243
  •  
  • 2013/05/05(日) 00:20:52.26
BBS_UNICODE=passは万能ではないってこと?

ここまで見た
  • 244
  •  
  • 2013/05/05(日) 00:47:04.03
てすと ヿ

ここまで見た
  • 245
  •  
  • 2013/05/05(日) 11:06:17.17
数値参照だと出るの?ヿ

ここまで見た
  • 246
  •  
  • 2013/05/05(日) 13:44:32.35
241は & が変換されてる

ここまで見た
  • 247
  •  
  • 2013/05/05(日) 17:19:43.57
テスト
ヿ

ここまで見た
  • 248
  •  
  • 2013/05/05(日) 17:20:33.68
変換されるなあ

ここまで見た
  • 249
  •  
  • 2013/05/10(金) 02:10:52.50
Open2chの文字コードは、UTF-8だ

<html lang="ja">
<head>
<title>宝くじ@open2ch掲示板</title><style>body{ margin:0; padding:0;}</style>
<link rel="alternate" type="application/rss+xml" title="RSS" href="http://http://engawa.open2ch.net/loto/index.rdf" />
<link rel="alternate" type="application/atom+xml" title="Atom" href="http://http://engawa.open2ch.net/loto/atom.xml" />
<script type="text/javascript" src="/lib/jquery/jquery-1.7.2.min.js"></script>
<script type="text/javascript" src="/lib/common.js?v2"></script>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link href="/lib/main.css?x" type="text/css" rel="stylesheet" />
</head><body text=#000000 link=#0000FF alink=#FF0000 vlink=#660099 background=/image/ba.gif>

ここまで見た
  • 250
  •  
  • 2013/05/12(日) 00:29:20.32
Old Hungarianは泥沼だな…

ここまで見た
  • 251
  •  
  • 2013/05/12(日) 15:25:57.78
よく知らない人でもわかるように簡単な解説希望

ここまで見た
  • 252
  •  
  • 2013/05/12(日) 23:40:04.51
Eversonが昔出した提案を前進させようとしたらハンガリー国内よりカウンター提案が
出てきた
そっちは稚拙だったのでEversonペースで進みかけたけど、カウンター提案者が
ハンガリーNBの座を獲得したので意向を無視できなくなった

以後ハンガリー国内で支持が割れて、この度ハンガリー国内から「今のEversonベースの
符号化案のまま行ってくれ」という署名リスト(N4420)と、「今の符号化案を投票から
外せ」という署名リスト(N4422)が届いた

ここまで見た
  • 253
  •  
  • 2013/05/12(日) 23:53:19.67
おっおおう…頭抱えたくなる状況だな

ここまで見た
  • 254
  •  
  • 2013/05/13(月) 12:17:49.20
なんか難しい話だな。
n4368(Everson)とn4367の戦いってことみたいだけど、
一例にdzの話を読むと、(梯子zの横に棒がついた文字)
これはもともとold hungerianになかった音/文字で、
n4368は現代では使わないから必要ないって立場(n4368 1.2)
n4367はこれは単なるd+zじゃないんだよ(n4367 5.4.1)

読み込めてないけど、
n4368は現代ハンガリー語に対応する正書法の提案も含まれていて、
n4367は歴史的な経緯を踏まえた提案になっている感じか。
たぶんold hungerianを、現代に復活させようとしている派(n4368)と、
歴史的な文字として登録しようとしている派(n4367)の戦いじゃないか。
n4420の"everyday use"とか、n4368 1.2の後半読むと。
学校でold hungerianを使わせる計画があるみたいだ。

ここまで見た
  • 255
  •  
  • 2013/05/13(月) 13:54:42.87
こういうのっていろんな分野で政治行政と歩調を合わせないといけないからほんと難しいよね。
単に自分(規格がらみ)が各方面と一対一で調整するだけじゃなくて、そいつら同士の橋渡しまで面倒見ないと何もまとまらないし。

ここまで見た
  • 256
  •  
  • 2013/05/13(月) 17:37:20.80
254です。
2,3時間読んでみただけで言うのも無責任だけど、
n4367の方がよさそうな気がするなあ。
Everson版は目的を限定しすぎてて、文字数も相当少ない。
かと言って合字が定義されてるわけでもない。
最初に網羅的にやっとかないと後で公開することになるはず。
あと、n4422によれば間違いも多いと書かれている。
実際どうか検証する知識はないけど、
n4367の方が引用している資料も多いし、一文字に対する検証も徹底的。
Eversonさんは膨大なスクリプトについてUnicodeに多大な貢献があるのは事実だけど、
専門家の意見も謙虚に聴くべきではないか?
まあUnicode専門家の意見も尊重しないといけないがね。

ここまで見た
  • 257
  •  
  • 2013/05/13(月) 22:34:08.76
>最初に網羅的にやっとかないと

日本人が言うとすごい説得力あるよねこれ

ここまで見た
  • 258
  •  
  • 2013/05/24(金) 01:09:40.80
Character encoding poetry
ttps://www.facebook.com/cmb/posts/619241744770551

ここまで見た
  • 259
  •  
  • 2013/05/24(金) 11:45:41.18
>>252は勘違いで、Everson案がUnicode的稚拙さで、
専門家が本格的な改正案を出してきたってところみたいだな。

ここまで見た
  • 260
  •  
  • 2013/06/01(土) 11:09:43.05
そういうものなのかね

ここまで見た
  • 261
  •  
  • 2013/06/24(月) 03:10:36.60
過疎ってるな

ここまで見た
  • 262
  •  
  • 2013/06/24(月) 06:46:38.91
ねたが無いからね

ここまで見た
  • 263
  •  
  • 2013/06/24(月) 15:04:34.93
坂村健みたいな逸材が必要とされている

ここまで見た
  • 264
  •  
  • 2013/06/27(木) 16:58:52.16
http://d.hatena.ne.jp/akane_neko/20130621/1371766405
これ読む限りだと安岡センセイもネタ切れなのかと

ここまで見た
  • 265
  •  
  • 2013/06/29(土) 23:43:50.69
安岡は基地外だから もう引退した方がいい

ここまで見た
  • 266
  •  
  • 2013/06/30(日) 02:05:47.38
最近のWG2の文書の中だとcedillaと下付commaの件が面白いな
結局下付commaの方は別途符号化することになったようだけど

ここまで見た
  • 267
  •  
  • 2013/06/30(日) 13:12:55.51
>>263 >>265 まだ基地外TRON信者いたんだ

ここまで見た
  • 268
  •  
さて

ここまで見た
  • 269
  •  
来週の

ここまで見た
  • 270
  •  
キテレツ大百科は

ここまで見た
  • 271
  •  
ツレテキ

ここまで見た
  • 272
  •  
スレが凍りついているわけだが

ここまで見た
  • 273
  •  
unicodeの歴史について勉強しようと思ったら初めからいきなり2バイト固定にしようとしていてズっこけた。
当時日本人はだれも突っ込まなかったんだろうか
あるいは当時のマシンスペックとの妥協とか政治的な何かとか理由があった?

ここまで見た
  • 274
  •  
いろんな人が突っ込んでたよ

ここまで見た
  • 275
  •  
スペックもあるだろうけどメモリが高価で容量も小さかったせいじゃないかな
当初は日常で使う字だけを符号化して特殊な字や古代の字はPUAを使わせるつもりだったとか
過去スレでそんな話題してるところがあったはず

ここまで見た
  • 276
  •  
そもそもUnicodeが使われる日が来るなんてみんな本気で信じて無かった

ここまで見た
  • 277
  •  
漢字ROMと文字一覧表(本?)でおk

ここまで見た
  • 278
  •  
ちょっと(かなり?)スレ違いなんだけど、
発音記号もそのうちIPA(国際音声記号)に統一されるのかしら。

ここまで見た
  • 279
  •  
汎用のものとしてはIPAを改正していくのが正攻法でしょう。
2005年にも唇歯はじき音が追加。

ここまで見た
  • 280
  •  
代用になるようなものもないからねえ…

ここまで見た
  • 281
  •  
その場しのぎの積み重ねでこんがらがった醜さはUnicodeよりも先輩だな

ここまで見た
  • 282
  •  
古文書がIPAで表されるのを想像……できん

ここまで見た
  • 283
  •  
想像してもいいんだぜ?

ここまで見た
  • 284
  •  
a%20%20%20a

ここまで見た
  • 285
  •  
(´・ω・`)?

ここまで見た
  • 286
  •  
ここ数ヶ月は話題なしか

ここまで見た
  • 287
  •  
http://www.itscj.ipsj.or.jp/domestic/sc02/hanyo-denshi/20100331/

最終更新日:2013年7月26日

情報規格調査会Webサイトの改ざんについて


6月17日(月)、情報規格調査会のサイト(http://www.itscj.ipsj.or.jp)が不
正と思われるアクセスを受け改ざんされたことを確認いたしましたので、直ち
に当該サイトを停止いたしました。

その後の調査で当該サイトに不正な javascript が埋め込まれていることを確
認いたしました。

6月15日(土)箸キ6月17日(月)に当該サイトを閲覧された方は、直ちに最新のウイ
ルス対策ソフトで感染の確認と駆除を実施いただきますよう、重ねてお願いい
たします。

現在、セキュリティ専門会社に詳細な分析を依頼しており、閲覧された皆様に
新たな対策が必要となりましたとき、或いは、追加情報が得られた場合には、
改めて情報規格調査会ホームページにてご案内いたします。

当該サイトを閲覧された方、また、関係者の方々にはに多大なご迷惑をおかけ
しましたことを深くお詫び申し上げます。不正アクセスへの対策を講じた後、
安全性を確認した上で再開の予定ですので、今しばらくお待ち頂きますようお
願いいたします。

情報規格調査会 委員長 伊藤 智

ここまで見た
  • 288
  •  
ちょっと笑った

ここまで見た
  • 289
  •  
紺屋の白袴

ここまで見た
  • 290
  •  
違うか、医者の不養生かな

ここまで見た
  • 291
  •  
おまわりさんが痴漢

お絵かきランド
フリック回転寿司
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード