Unicodeテキストの行単位的処理

Unicode/UTF-16LEの場合の行単位的処理である。UTF-8で苦労したのに比べるとこちらははるかに簡単である。
これも最初からフルセット版は面倒なので、改行は「CRLF」「LF」に限定してやっていこう(→検討用ソース)。なお、現在ではどの改行コードにも対応している(2014/05/06)。
なお、これは以前はファイル単位的に処理していたものである。

各行ごとにUnicodeのデータを取得し(左側)、それをShift_JISに変換し(右側)、ファイルに保存するということを最後まで繰り返す。
Shift_JISのナマデータはExcelでは表示できないから当然文字化けする。
これをもって「正常に変換されていない」と即断することはできない。誤解しないように。

UnicodeShift_JIS

UnicodeShift_JIS

UnicodeShift_JIS


以下は変換前のUnicodeデータと変換後のShift_JISのデータである。
正常に変換されていることがわかる。ただ、Shift_JISのナマデータはExcelでは表示できないというだけのことである。



- 2014/05/04 -




SOURCE
検討用/CRLF改行のUnicodeをSJISに変換する(c1)




Unicode,UTF-8,UTF-16,Big,Little,Endian,LE,BE,Shift_JIS,SJIS,CR,LF,CRLF,byte,bit,word,CSV,BOM,Encode,Decode,ANSI, Binary,Open,Byte,Get,Put,InputB,AscB,Hex,Mod,LOF,Loc,FreeFile,ReDim,Encoding, バイナリ,テキスト,文字列,文字コード,16進コード,16進文字列,変換,ビッグ,リトル,エンディアン,ユニコード,改行,サンプル, バイト,ビット,ヘキサ,2進数,16進数,読み込み,書き込み,エンコード,デコード,解析,変換,判定,判別,バイナリエディタ, 全角,半角,カタカナ,ひらがな,漢字,