文字コード総合スレ part8 [sc](★0)
-
- 209
- 2013/04/07(日) 02:51:00.36
-
ttp://www.seiai.ed.jp/sys/text/java/utf8table.html
UTF-8は1〜4バイト(初期の定義では6バイトまで)の可変長コード
00-7x 1バイト文字 US-ASCIIにおなじ
8x,9x,Ax,Bx 多バイト文字の2バイト目以降
Cx,Dx 2バイト文字の開始バイト
Ex 3バイト文字の開始バイト
Fx 4バイト以上の文字の開始バイト
つまり
00-7fは元の文字
c0-ffなら「u」+バイト列をそれぞれ出せばいいわけだろ
UTF-16なんて必要ないな
native2asciiの挙動?
使いもしねえもの知るかよ
このページを共有する
おすすめワード