見えるUnicode

文字からUnicodeのコード番号を取得する。コマンドプロンプトから日本語を入力するには、[Alt] + [漢字] でIMEが起動するようである。
これはちょっとUnicodeの文字コードを知りたいという場合に便利に使える。



見えるUnicodeの応用

上のようなことを少し応用すると次のようなものができる。
Shift_JISで書かれたテキストファイル(下の例ではsjis.txt)を読み込んで、そこに出てくる文字について、1文字ずつそのUnicodeの文字コードを表示していく。


これはメモ帳で作ったもので、Shift_JISのCR/LF改行のテキストであるが、上の画面をみてもわかるように、内部的には改行はLFに変換されて処理されていることがわかる(0x000Aしか表示されていない)。

これはマルチバイト文字でできたテキストの文字単位的処理(非バイト単位的処理)というトピックとも関連してくる。


改行

画面表示する場合は改行は出力しないほうがよい。
いわゆるCR/LFを削除した場合である。しかし、このプログラムで操作するかぎりは「CR」は存在しないから、「LF」だけを削除しても同じ結果になる。







mb_ucode_stdin/コマンドラインから1文字入力してそのUnicodeのコード番号を表示(ccp_0332)
mb_ucode_file/MBCSテキストからそのUnicodeのコード番号を表示(ccp_0333)
w系関数のテキストモードでの動作(ccp_0244)