文字コード総合スレ part8 [sc](★0)
-
- 1
- 2012/11/30(金) 13:16:02.46
-
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
-
- 789
- 2014/03/12(水) 16:49:07.31
-
なんで文字に番号振るだけなのに
研究とかしてんの?
-
- 790
- 2014/03/12(水) 16:55:22.46
-
「文字とは何か」という哲学的な命題が背後にあるから
-
- 791
- 2014/03/12(水) 19:11:13.07
-
>>788
日本の0212はSJIS対象外だから無視w
あれはほぼPC,Macの文字コード範囲くらいしか互換対象になってない。
中国のPCで大文字だけ使えたらしい。
-
- 792
- 786
- 2014/03/12(水) 22:16:09.94
-
>>787
調べてみたら、 GB 2312 だと小文字の方しか含まれていないようでした。
ttp://zh.wikipedia.org/wiki/%C3%81
JIS X 0212 などが反映されていない、というのは、
そもそも East Asian Width が古い文字コードとの互換性のためのものなので、
比較的新しい文字コードには対応しない、ということですかね。
うーん、ややこしい。
-
- 793
- 2014/03/16(日) 19:03:10.60
-
Unicodeで互換用に残されてるけど使うべきじゃない文字ってどこかにまとまってる?
-
- 794
- 2014/03/20(木) 21:44:45.24
-
バベルのページ見てたら
「バベルでの変換は特に明記していない限り MS-Windows の IE をお手本にしています。」
ってあるけどIEの変換方法って公開してるんだっけ?探しても見つからないんだけど
-
- 795
- 2014/03/20(木) 22:12:54.66
-
バベルってのが分からんが、MS純正の文字コードAPIの変換使ってるだけなんじゃないの?
-
- 797
- 2014/04/01(火) 00:33:15.13
-
さて
-
- 798
- 2014/04/05(土) 21:32:13.78
-
cp932 = シフトJIS?
シフトJISっていう名称はどこかに登録されてる?
Shift_JISはIANAで登録されてると思うけど
-
- 799
- 2014/04/05(土) 21:46:04.47
-
>>798
されていない
-
- 800
- 2014/04/06(日) 08:01:34.90
-
JISの用語は「シフト符号化表現」だっけ?
あと、正式でない用語は、正確に実装されていないものとか、似たものを総称してとか、
そういうものを表現するために便利に使われている。
-
- 801
- 2014/04/06(日) 15:32:34.79
-
JIS X 0208:1997ではね。
JIS X 0213:2004移行はShift_JIS-2004だよ。
JIS X 0213で文字増えた文も含むのはShift_JISX0213で。
-
- 802
- 2014/04/06(日) 16:46:46.91
-
JISのシフトJISなんて当時の世の中の標準を
無視できなくなって遅れて書いただけだろ。
世間で「シフトJIS」と言ったときには
JISのそれを指すことなど安岡信者とその取り巻きを除いて
皆無に近い
-
- 803
- 2014/04/06(日) 17:21:32.69
-
カッチリした規格があるのは重要。
-
- 804
- 2014/04/06(日) 20:48:52.12
-
どの文字コードであれ正解は役所とかで実際に運用されている文字コードが正解になる
つまり何が正しいかの探求は役所への取材から始まる
-
- 805
- 2014/04/06(日) 22:15:42.61
-
職場の愚痴はマ板行けよ。
-
- 806
- 2014/04/07(月) 06:25:47.71
-
やなこったw
-
- 807
- 2014/04/07(月) 09:46:47.69
-
経産省は役所じゃないのか
-
- 808
- 2014/04/07(月) 09:49:42.18
-
>>798
Windows-31JだけどIEが対応していないので事実上使えない
Encoding StandardではShift_JIS = cp932 - PUA
-
- 809
- 2014/04/07(月) 11:17:13.52
-
ぷあっ
-
- 810
- 2014/04/08(火) 19:37:24.54
-
大江健三郎もびっくり、あいまいな日本のエンコーディング
もう疲れたからユニコードでいいです。
昨日ウブンツを適当に入れて日本のホームページを見たら
一部の漢字が見慣れない形をしていましたが
そのぐらいのことは我慢します。
-
- 811
- 2014/04/11(金) 23:11:28.88
-
http://slashdot.jp/~yasuoka/journal/579915
安岡センセイ迷走してるみたいだけど結局何が言いたいのだろう
-
- 812
- 2014/04/12(土) 01:12:45.44
-
むしろここで一人で安岡ヲチしてる人こそ何をしたいのかよくわからん…
このスレや過去スレを「安岡」でスレ内検索してみるとものすごく異様。
-
- 813
- 2014/04/12(土) 13:33:41.81
-
安岡さんが、キーボード配列の件で坂村さんを「デマ発信源」認定したのが気にくわない、
某方面のアレな信者でしょw
-
- 814
- 2014/04/12(土) 15:05:23.03
-
坂村さんは今風に言えば
御用学者だよな
-
- 815
- 2014/04/14(月) 11:59:40.17
-
>>813
本人乙
-
- 816
- 2014/04/15(火) 21:27:59.56
-
じゃなきゃ南堂信者か本人
-
- 817
- 2014/04/15(火) 21:51:19.51
-
まあそれはともかく「ちゃんとしたIVSがほしいからあえてIVSと呼んでいる」は
本気で意味わからない。名前が気に入らないってだけ?
-
- 818
- 2014/04/15(火) 23:18:51.37
-
スラドにコメントしろよ
-
- 819
- 2014/04/16(水) 00:47:06.39
-
うむ。
-
- 820
- 2014/04/17(木) 21:25:09.42
-
本人認定とか、完全にまじキチ君だな。
-
- 821
- 2014/04/17(木) 21:36:39.35
-
どうでもいいよもう。
とりあえず安岡叩きしてる人はどこか味方のいる場所を見つけてそっちで好きなだけやってくれ。
ここで叩いても誰も賛同せずに今回みたいな流れになるだけだからさ。
-
- 822
- 2014/04/19(土) 02:41:39.74
-
ネットのテキストをコピーすると、たまに文字コードの異なる半角スペースがあるのが困る。
-
- 823
- 2014/04/19(土) 05:54:36.53
-
?
-
- 824
- 2014/04/19(土) 09:54:13.30
-
どちらかというと「安岡」という単語に猿のレベルで脊髄反射して
トロン信者認定のレスを貼る安岡信者の方がすごいと思う
-
- 825
- 2014/04/19(土) 13:11:12.57
-
>>824
過去ログに残る執拗な叩きの痕跡という前提がまるで存在しないかのように、
件の彼に対する反応を「『安岡』という単語に猿のレベルで脊髄反射」ってことにするのはどうかと。
あなたが同列に「どちらがすごいか」を比べてるのが奇妙に思えるほど、件の彼の行動は異質。積み重ねがあるからね。
そしてもちろん、件の彼について話している人は
「この人はなぜ、疎まれることがわかっている場でなお1人で叩き書き込みを続けるモチベーションを持っているのだろう?」
という点を不思議に思って集まっているんであって、書き込みの動機は明確。ここから「安岡信者」と解釈はしづらい。
また、仮にもしそのなかに「安岡信者」が紛れ込んでいたとして、
その信者はこのスレで執拗に「敵」を叩き続けたりはしていない。
件の彼と違って人畜無害なのだから、ほうっておけば良い。
-
- 826
- 2014/04/19(土) 13:15:43.09
-
おれなんでこのスレ常駐してんだっけ……
-
- 827
- 2014/04/19(土) 13:43:05.46
-
>信者はこのスレで執拗に「敵」を叩き続けたりはしていない。
これには同意。
安岡信者は被害妄想が激しく
単発のレスで偏執に被害を主張するのが特徴だからね。
-
- 828
- 2014/04/19(土) 17:03:56.09
-
>>822
NBSPが紛れこんでてイラっと来るやつかな
-
- 829
- 2014/04/20(日) 08:23:30.09
-
信者とか言い出す時点でどの発言も議論として無価値
-
- 830
- 2014/04/21(月) 10:53:47.48
-
> 被害妄想が激しく
> 単発のレスで偏執に被害を主張するのが特徴だからね。
安岡さんに対して執拗に粘着している君の特徴じゃないかw
-
- 831
- 2014/04/21(月) 19:22:16.02
-
安岡センセイもビットコインに走っちゃったから…
…おっと誰か来たようだ
-
- 832
- 2014/04/22(火) 02:46:51.52
-
誰も来てない
-
- 833
- 2014/04/22(火) 16:39:21.34
-
よそでやれよ気違いども
-
- 834
- 2014/04/23(水) 01:02:12.57
-
サロゲートペアがらみで文字化けとか文字落ちは未だに良くありますか?
合成文字(アイヌ語表記用)などがうまく処理できないんですけど、完全にサポートをしないと割り切った人はいますか?
-
- 835
- 2014/04/23(水) 01:11:50.85
-
サロゲートペアかどうかの判定なんていちいち入れないし
固定長に可変長混ぜたら何の意味もない
-
- 836
- 2014/04/23(水) 01:58:46.32
-
何か誤解してる様だが、元々Unicodeの文字表現は可変長
-
- 837
- 2014/04/23(水) 18:34:35.68
-
はじめは16bit固定じゃないの?
-
- 838
- 2014/04/23(水) 20:59:37.84
-
「元々」って「当初は」って意味で書いてないのか
すまん
-
- 839
- 2014/04/23(水) 21:11:18.40
-
「か」と「゛」で「が」みたいに
二文字で一文字を表す合字があるんだから、
言語機能かライブラリを使うしか
現実的な対応方法ないだろ。
逆に言えば、それらを使っていれば
無視できる問題。
このページを共有する
おすすめワード