文字コード総合スレ part8 [sc] | レス855-906 | 2ch過去ログ

★お気に入り追加

■ このスレッドは過去ログ倉庫に格納されています

1 2012/11/30(金) 13:16:02.46

プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
（スレ再利用）UnicodeとUTF-8の違いは？ http://pc12.2ch.net/test/read.cgi/tech/1177930957/
（隔離スレ）UnicodeとUTF-8の違いは？　その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/

砂時計アラームタイマー

フリックラーニング

ここまで見た

855 2014/04/25(金) 15:01:18.03: 別にC言語風だからどうでもいいよ

ここまで見た

856 2014/04/25(金) 15:34:10.60: たまには。PDPエンディアンのことも思い出してあげて

ここまで見た

857 2014/04/25(金) 15:49:44.73: エンディアン嘘つかない

ここまで見た

858 2014/04/25(金) 17:51:44.43: >>845
UCSとUTFの区別は最初はなかった。
最初はUCSのみ。
>>845も書いてるけど。

ここまで見た

859 2014/04/25(金) 17:56:44.39: >>847
UTF-16文字列はuint16_tの並び。
uint16_tだからCPUによってバイト順が違う。
だからエンコーディングのバイトオーダーが決まってると、
逆順のシステムはネットワークにデータを流す時にバイト順を毎回変えないといけない。
それを防ぐためにバイトオーダー順違いのエンコーディングが定義されてる。
こうしておくと必要なときだけバイト順を変えればいい。
DCE/RPCみたいに接続時にバイトオーダをネゴしてもいいし、
どちらを送られても必ず扱えるようにしてもいい。

ここまで見た

860 2014/04/25(金) 18:34:47.40: レスありがとう
2つの(代表的な)エンディアンがあってだからBEとLEがありますだと理由付けとして弱い、何か他にあるんじゃないの？？って疑問でした。
だから
>処理を速くするためにCPUに合わせた形式でメモリには格納しないといけない。
という事情があると知り納得しました。

ここまで見た

861 2014/04/25(金) 20:13:07.53: 2つしかない。

ここまで見た

862 2014/04/25(金) 20:28:19.84: Unicode規格のエンコーディングフォームと
エンコーディングスキームの区別が全く
ついていない人が集うスレはここですか？

ここまで見た

863 2014/04/25(金) 20:41:42.68: >>862
あなたもその一人です。

ここまで見た

864 2014/04/25(金) 21:32:54.46: キター
パーソナルメディア、Unicode　IVS／IVDを活用する異体字検索入力ツールを発売
http://itpro.nikkeibp.co.jp/article/ActiveR/20140422/552244/

ここまで見た

865 2014/04/26(土) 07:57:34.66: IVS流行るんかねぇ
今3000字くらいだっけ？登録されてるの

ここまで見た

866 2014/04/26(土) 20:11:54.73: 有料なのかよ
babelmap使えばいいな

ここまで見た

867 2014/04/27(日) 06:28:54.53: 先月までレビューをやってた新しいIVDはその後どうなったんだろ

ここまで見た

868 2014/04/27(日) 06:55:39.54: >>866
しかも10ライセンス単位
それでも一般販売されるようになっただけ一歩前進

ここまで見た

869 2014/05/01(木) 02:19:11.86: 20年以上前に MS-DOS で
grep "\["
ってやって、関係ない漢字が大量にヒットした時の絶望感。
Microsoft を捨てる理由になり得るということを
理解してくれる人は少ない。

ここまで見た

870 2014/05/01(木) 02:54:30.27: ほー。

ここまで見た

871 2014/05/01(木) 06:02:50.85: へー。

ここまで見た

872 2014/05/01(木) 17:37:23.88: MS-DOSにgrep有ったのか

ここまで見た

873 2014/05/01(木) 17:56:01.26: アスキーの Software Tools for MS-DOS 他、いろいろあったよ

ここまで見た

874 2014/05/01(木) 18:34:21.61: マイクロソフト以外のツールの出来が悪いと
Microsoft を捨てる理由になり得る　のか

ここまで見た

875 2014/05/01(木) 19:06:00.71: 「Microsoft漢字コード」って意味じゃねーの？

ここまで見た

876 2014/05/01(木) 21:32:54.04: 「Microsoft漢字コード」って意味です。
それ以外にも理由は山ほどありましたが。
その後、Pentium マシン買ってとっとと Linux 入れて
Microsoft を捨てました。前世紀のことです。
エンコーディングは当初は euc-jp , 後に utf-8 。

プリインストールされていた windows 98 を有効利用しようと
一応は努力したんですよ。10日間くらい。

ここまで見た

877 2014/05/02(金) 03:26:51.56: >>873
特に緑の256本にお世話になりました。

ここまで見た

878 2014/05/02(金) 08:40:36.13: まあバカには難しいからな

ここまで見た

879

ニュース記事より

2014/05/02(金) 12:43:16.91: UTF-16 で、+2D 91+A9 52 7D 00+9F 53+ って何ですか？
tp://headlines.yahoo.
co.jp/hl?a=20140427-00000009-asahi-int

ここまで見た

880

880

2014/05/02(金) 13:14:16.23: Internet Explorer を外したら上手くいきました。(._.)

ここまで見た

881 2014/05/07(水) 23:28:11.14: utf-1のオリジナルの仕様書はどこかに無いですかね？

ここまで見た

882 2014/05/08(木) 01:59:00.77: >>881
なにそれ？ 1bit encode?

ここまで見た

883 2014/05/08(木) 02:19:16.15: 8bitだな

ここまで見た

884 2014/05/08(木) 22:39:56.65: 数字の付け方が途中で変わったからねぇ。

ここまで見た

885 2014/05/09(金) 22:59:45.07: JIS X 0201の「ヲ」ってなんであんな位置にあるの？
「ワ」と「ン」の間じゃダメだったの？

ここまで見た

886 2014/05/10(土) 00:58:26.77: 不思議だワン

ここまで見た

887 2014/05/10(土) 01:01:06.78: 今主流は、ISO/IEC 8859-15? Windows-1252 ? unicode?

ここまで見た

888 2014/05/10(土) 01:09:42.82: あらゆる隔たりを越えて使われてるコードってなんだろ

ここまで見た

889 2014/05/10(土) 03:27:31.59: >>888
ASCIIコード

ここまで見た

890 2014/05/10(土) 03:29:41.16: JSON
Base64

ここまで見た

891 2014/05/10(土) 11:13:27.62: せめて文字コードからお願いします

ここまで見た

892 2014/05/10(土) 11:17:48.14: お客さまの文字コードを戴いてもよろしいでしょうか

ここまで見た

893 2014/05/10(土) 11:20:07.72: >>881
英語版ウィキペからのリンクで見つけた。
http://kikaku.itscj.ipsj.or.jp/ISO-IR/178.pdf
>>884
UTF-8はUTF-2という名前だったな

ここまで見た

894 2014/05/10(土) 13:26:02.15: >>893
オリジナルは ISO 10646-1:1993 = Unicode 1.1だな。

ここまで見た

895 2014/05/10(土) 15:12:57.31: Unicode 1.1だけはunicode.orgのサイト上にもないんだね。
http://www.unicode.org/versions/enumeratedversions.html
無慈悲な(paper only)

ここまで見た

896 2014/05/10(土) 20:17:48.99: Adobe-Japan1-6が出てもう10年か
これだけ放置ってことは1-7は実質的にキャンセルされたかな

ここまで見た

897 2014/05/11(日) 00:27:45.38: 世の中はWindows-1252か、それをUTF-8化した文字コードが主流だね。

ここまで見た

898 2014/05/11(日) 14:18:48.58: 㐂驒沪𡈽圡玊琢簞箪簟單俱倶傎叱𠮟
咕吒哎噓嘘墟吞呑櫛樿撣
味噌
葛飾区
祇園
進歩
噂
湮滅
恰好
義捐金
眩惑
激昂
幻惑
渾然
駿足
醇朴
饒舌
食事療法
食餌療法
擡頭
醜名

ここまで見た

899 2014/05/11(日) 14:22:59.36: >>876
外部ツールのgrepが特定の文字コードに対応してなかっただけだろ？

ここまで見た

900 2014/05/11(日) 14:24:59.03: 人名にある漢字
&#164660;　U+28334(D860 DF34)
&#136014;　U+2134E(D844 DF4E)
&#168087;　U+29097(D864 DC97)
&#135963;　U+2131B(D844 DF1B)
&#64069;　 U+FA45
わかりやすい一表式誤字俗字・正字一覧
戸籍の氏又は名の記載・記録に用いる文字
戸籍実務研究会　編　日本加除出版
shift-jisではなくUnicodeで記述してくれ。

むずかしくないぞ！！誤字俗字・正字
小林勝彦　著　日本加除出版
子の名に使える漢字字典
改定常用漢字表対応
戸籍実務研究会　編　日本加除出版
人名用漢字の変遷
子の名に使える漢字の全履歴
日本加除出版株式会社編集部　編
日本加除出版

ＣＪＫＶ日中韓越情報処理　オライリー
新しい国語表記ハンドブック　三省堂
校正必携　日本エディタースクール
記者ハンドブック　共同通信
日本人の知らない日本語

ここまで見た

901 2014/05/11(日) 15:03:04.80: 外字管理と文字同定
合理的な外字作成のために
長村玄　著　日本加除出版

参考
http://blog.livedoor.jp/blackwingcat/archives/983407.html
http://blog.livedoor.jp/blackwingcat/archives/775319.html

&amp;#127924;
サロゲートペア
1F3B4　花札の坊主
1F3B6
1F4A9
1F4B4
1F5FE
1F5FC

ここまで見た

902 2014/05/11(日) 16:31:11.95: 結局、どれがええんじゃ？

ここまで見た

903 2014/05/11(日) 16:59:11.70: >>898
邦題『湮滅』の仏語原文はeのリポグラムで書かれているそうで、
翻訳の方も「い段」の仮名がなかったりのこだわり本。
どうでもいいな、スレチだし

ここまで見た

904 参考 2014/05/11(日) 22:41:39.55: http://www.amazon.co.jp/dp/4899772939/
文字コード「超」研究　改訂第2版
深沢千尋

http://www.amazon.co.jp/dp/477414164X/
プログラマのための文字コード技術入門 (WEB+DB PRESS plus)
矢野啓介

http://www.amazon.co.jp/dp/4891006080/
UnicodeによるJIS X0213実装入門―情報システムの新たな日本語処理環境
(マイクロソフト公式解説書―マイクロソフトITプロフェッショナルシリーズ)
田丸健三郎

http://www.amazon.co.jp/dp/4822294838/
Unicode IVS/IVD入門
田丸健三郎　小林龍生

http://www.amazon.co.jp/Unicode/dp/4798100307/
Unicode標準入門　　発売日　2001/05
トニーグラハム

ここまで見た

905 2014/05/12(月) 01:09:45.43: Unicode IVS/IVD入門は誤植とツッコミどころ満載(著者のせいというよりは編集が仕事してない)なので、
togetterだかにまとめられてるツッコミを確認しながら読むべし。

ここまで見た

906 2014/05/12(月) 11:07:44.74

互換漢字の表が正規化で全部統合漢字に化けていたのはひどかった

フリック回転寿司

フリックラーニング

ここまで見た

★お気に入り追加

このページを共有する

おすすめワード

スレッドランキング

1位藤本美貴「誰が一汁三菜って言い出した？」伝統の食事スタイル...(109)
2024-11-14 17:30 [sc] 2位「Ｚ李」原作の１月公開Ｌｅｍｉｎｏオリジナルドラマの配信可...(67)
2024-11-14 17:06 [sc] 3位【テレビ】「水ダウ」出演でトレンド入りの大仁田厚、５度の電...(68)
2024-11-14 16:56 [sc] 4位【話題】「世界で最もセクシーな薄毛男性」発表　2位はドウェ...(183)
2024-11-14 16:51 [sc] 5位【ゲーム】『ドラゴンクエストIII そして伝説へ…』伝説のタイ...(164)
2024-11-14 16:27 [sc]

6位「＃さよなら俺たちの松ちゃん」松本人志　訴訟取り下げで見限...(599)
2024-11-14 16:21 [sc] 7位「友人が松本人志から性被害」発言の遠藤舞が謝罪「真偽不明の...(346)
2024-11-14 15:02 [sc] 8位【野球プレミア12】侍ジャパンオーストラリア戦の視聴率10・...(577)
2024-11-14 14:53 [sc] 9位 YouTuberちくわ、戸塚ヨットスクール校長のモノマネで「ヒトラ...(161)
2024-11-14 14:37 [sc] 10位「＃さよなら俺たちの松ちゃん」松本人志　訴訟取り下げで見限...(1001)
2024-11-14 14:04 [sc]

同一板（プログラム板）のスレッドリスト

高2の授業でアプリを作るんや。案を募集するやで(26)
2024-11-06 06:43 [sc] 【PHP】下らねぇ質問はここに書き込みやがれ 15(32)
2024-10-29 20:52 [sc] AIの執筆した記事(13)
2024-10-10 08:50 [sc] 個人開発者の雑談スレ(23)
2024-10-02 05:56 [sc] プログラミングに詳しくて辛抱強い人来て(34)
2024-09-30 21:47 [sc]

Pythonのお勉強 Part74(320)
2024-09-21 10:14 [sc] Rust part26(800)
2024-09-20 22:18 [sc] DoS攻撃ツール作ろうぜ(26)
2024-09-09 11:53 [sc] 【まず1嫁】くだすれPython(超初心者用) その60(80)
2024-09-01 19:58 [sc] WPF(.NET, WinUI) GUIプログラミング Part33(323)
2024-08-20 21:16 [sc]

おすすめスレッド[芸能音楽速報板]

【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(93)
2024-11-11 23:29 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(526)
2024-10-26 22:25 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(991)
2024-10-09 07:10 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(617)
2024-10-03 12:46 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(681)
2024-09-28 09:54 [sc]

【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(477)
2024-09-25 23:57 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(752)
2024-09-06 21:01 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(770)
2024-08-28 13:05 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(643)
2024-08-22 06:59 [sc] 【音楽・新譜】CD・DL・ストリーミングチャート/売上議論・予...(885)
2024-07-14 10:49 [sc]

速報スレッド

【独自】国民・玉木雄一郎氏の実弟「3000万円詐欺」疑惑で告訴...(98)
2024-11-14 19:33 [sc] 猟友会『警察がやる？おーやってみろよｗヒグマのエサになるだ...(14)
2024-11-14 19:33 [sc] トリプルレッド [725951203](14)
2024-11-14 19:28 [sc] ローソンストア100「だけ弁当(イシイのミートボール)」11月20...(50)
2024-11-14 19:25 [sc] 平成初期のディーゼルエンジンおじさんはエンジンスタートする...(27)
2024-11-14 19:22 [sc]

【裏オプション】メンズエステで「美人局」、被害急増　恐喝・...(40)
2024-11-14 19:20 [sc] 【🍗】KFC「とりの日パック」11月28日リニューアル、オ...(79)
2024-11-14 19:20 [sc] 高裁「弾が跳ねたら建物に当たるよね」ハンター「無理っスよ無...(114)
2024-11-14 19:12 [sc] 英有力紙・ガーディアン「Xは極右の陰謀論や人種差別など不穏...(40)
2024-11-14 19:10 [sc] 真面目に統合失調症だと言うと雇う所がないからな、作業所に行...(14)
2024-11-14 19:06 [sc]