半角カタカナを全角カタカナへ変換

前に試作(ipc_0088)した「半角カタカナを全角カタカナへ変換」の部分で見落としがあった。

あの時は「文字」ばかりに目が向いてしまっていたが、昔の半角カタカナを使ったテキストには、句読点やカギカッコや中点(なかてん)も使われていた。下のA1~A5までの部分である。


それらも全角にしなければならない。
そこで修正したのがこのuni_kana_h2z.cppである(ほぼ決定版)。


これで変換したconv_z.txtは次のようになる。
参考
これは半角カタカナのファイル。
ボクは「ポパイ」。ホウレンソウ、ハンバーガーが好き。
本田美穂ABC123。ホンダミホ・シノザキアイ。
篠崎愛はかわいい。



ひらがなの長音符の変換
こういうふうにやってくると、「半角カタカナ」を「全角ひらがな」にする場合も、ipc_0088でやったように杓子定規に、「ひらがな」には長音符はないから「ー」が出てきたら一律削除する、というのもどうかなという気になる。

こんなものを使っているのは専門の国語オタクではない。半角カタカナという前世紀の遺物を後生大事に抱え込んだ、頭にカビが生えたようなパソコンオタク(いわゆる骨董品)だけである。こういう連中ではカタカナの「ー」をひらがなに混ぜて使ったところで何の問題もないのかもしれない。

そこで試作してみたのがuni_kana_h2zh.cppである(ほぼ決定版)。


これで変換したconv_h.txtは次のようになる。
参考
これは半角カタカナのファイル。
ぼくは「ぽぱい」。ほうれんそう、はんばーがーが好き。
本田美穂ABC123。ほんだみほ・しのざきあい。
篠崎愛はかわいい。





ExcelVBAで半角カタカナを全角カタカナに変換(ipc_0078)
ExcelVBAで文字種ごとに全角半角の相互変換(ipc_0168)


uni_kana_h2z.cpp(ccp_0342)
uni_kana_h2zh.cpp(ccp_0343)




Unicode,UTF-8,UTF-16,Big,Little,Endian,LE,BE,Shift_JIS,SJIS,CR,LF,CRLF,byte,bit,word,CSV,BOM,Encode,Decode,ANSI, バイナリ,文字コード,16進コード,文字列,ビッグ,リトル,エンディアン,ユニコード,改行,バイト,ビット,テキスト, 半角,全角,カタカナ,ひらがな,カナ,漢字,エンコード,デコード,16進文字列,C言語,C++言語,変換,解析,判定,判別,サンプル, _mbslen,_mbsnccnt,_mbsnbcnt,_mbctombb(zentohan),_mbbtombc(hantozen),_mbctohira,_mbctokana,MBCS,char,unsigned, _mbctolower,_mbctoupper,_mbcjistojms,_mbcjmstojis,_mbbtype,_mbsbtype,mbstowcs,wcstombs,mbtowc,wctomb, マルチバイト,MultiByteToWideChar,WideCharToMultiByte,