拡張文字
WindowsはJIS第1および第2水準漢字(JIS X 0208に規定されている6,355文字)をベースとしたShift_JISの漢字に加え、JIS補助漢字(JIS X 0212に規定されている5,801文字)を加えた12,156文字の漢字を標準フォントとしてサポートしている。この日本語拡張文字はUnicodeをサポートしたアプリケーションで使用できる。
LOG
117.103.185.20 [12/Jun/2017:09:33:40] ipc_0049 utf-16 vba 拡張文字
117.103.185.20 [12/Jun/2017:09:34:30] ipc_0012 utf-16 vba 拡張文字
117.103.185.20 [12/Jun/2017:09:43:11] ipc_0079 utf-16 拡張文字 vba書き方
「拡張文字」とは外字のことか。それともその文字コード体系に属する本来の文字以外に付加的に追加された文字(どんな文字だ?)のことか。それはよくわからない。
しかし、アプリケーションでJIS補助漢字(JIS X 0212に規定されている5,801文字)が正常に表示されないことがある。この日本語拡張文字が表示されないまたは文字化けが発生するのは次の場合である。
- Unicodeをサポートしていないアプリケーションの場合
以前(Windows3.1/95)のメモ帳などのアプリケーションはUnicodeに対応していなかったため、JIS補助漢字(JIS X 0212の文字を表示することはできなかった。
- 日本語拡張文字に対応したフォントがない場合
Unicodeに対応したアプリケーションでも日本語拡張文字に対応したフォントがないときもこの現象が起こる。
いずれにしても、UnicodeはShift_JISに比べて文字数は格段に多い。Unicodeの「拡張」文字など(がもしあるとしても)現実に使うことがあるのか疑問である。
ところで、上のような検索をしているのは日本最大最強の愚民集団であるエクセルバカである。まともな言語能力はない。バカの書いていることは無意味であるという原則からすれば、おそらくどうでもいいような「つまらないこと」を指している可能性が大きい。
余話
上はいずれも「bing$com」からのものである。bingには次のような副作用がある。
LOG
204.79.180.0 [15/Jun/2017:10:54:16] ipc_0012 utf-16 vba 拡張文字
これは隠れbingである。上のようなキーワードでの呼び出しがあったため、こういうリンクを捏造しているのである(フェイク)。Microsoftがバカを作り拡散しているといっても過言ではない。
- 2017/06/12 -
文字コード
プログラムやスクリプトで実行確認用に文字コードが必要になったときに使う。このサイトでは日本語の文字コードの確認などには頻繁に使っている。
文字コード | 篠 | 崎 | 愛 |
UNICODE | 7BE0 | 5D0E | 611B |
SHIFT_JIS | 8EC2 | 8DE8 | 88A4 |
EUC-JP | BCC4 | BAEA | B0A6 |
JIS | 3C44 | 3A6A | 3026 |
区点 | 28-36 | 26-74 | 16-06 |
文字コード | 本 | 田 | 美 | 穂 |
UNICODE | 672C | 7530 | 7F8E | 7A42 |
SHIFT_JIS | 967B | 9363 | 94FC | 95E4 |
EUC-JP | CBDC | C5C4 | C8FE | CAE6 |
JIS | 4B5C | 4544 | 487E | 4A66 |
区点 | 43-60 | 37-36 | 40-94 | 42-70 |
文字コード | 本 | 田 | 美 | 穂 | 篠 | 崎 | 愛 |
UNICODE | 672C | 7530 | 7F8E | 7A42 | 7BE0 | 5D0E | 611B |
SHIFT_JIS | 967B | 9363 | 94FC | 95E4 | 8EC2 | 8DE8 | 88A4 |
EUC-JP | CBDC | C5C4 | C8FE | CAE6 | BCC4 | BAEA | B0A6 |
JIS | 4B5C | 4544 | 487E | 4A66 | 3C44 | 3A6A | 3026 |
区点 | 43-60 | 37-36 | 40-94 | 42-70 | 28-36 | 26-74 | 16-06 |
検索ツール
一般的な文字コードの検索(by PHP)
文字コードごっこ
バイナリ、UNICODE(UTF-8/UTF-16)、文字コード(エンコード)、16進数、エンディアン、改行(CR/LF)、暗号化などで遊ぶこと。
「文字コードごっこ」をするには特別のソフトも環境もいらない。プログラミングの中では最も手軽で安価にでき、文字が書けるようなパソコンなら誰でも簡単に楽しめる。その反面、どれも実用性はほとんどない。
LOG
210.163.138.196 [23/Feb/2018:19:35:14] ipc_0097 文字コード 94fc
LOG
218.224.236.125 [19/Oct/2020:16:29:59] ipc_0094 csv 漢字 第二水準
「csv」など何の関係もないが、エクセルバカでは必ず出てくる。
Unicode,UTF-8,UTF-16,Big,Little,Endian,LE,BE,Shift_JIS,SJIS,CR,LF,CRLF,byte,bit,word,CSV,BOM,Encode,Decode,ANSI,
バイナリ,文字コード,16進コード,文字列,ビッグ,リトル,エンディアン,ユニコード,改行,バイト,ビット,テキスト,
半角,全角,カタカナ,ひらがな,カナ,漢字,エンコード,デコード,16進文字列,C言語,C++言語,変換,解析,判定,判別,サンプル,
_mbslen,_mbsnccnt,_mbsnbcnt,_mbctombb(zentohan),_mbbtombc(hantozen),_mbctohira,_mbctokana,MBCS,char,unsigned,
_mbctolower,_mbctoupper,_mbcjistojms,_mbcjmstojis,_mbbtype,_mbsbtype,mbstowcs,wcstombs,mbtowc,wctomb,
マルチバイト,MultiByteToWideChar,WideCharToMultiByte,