view nkf-utf8/nkf_utf8.txt @ 12:441a2190cfae

Lion fix
author Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date Sat, 21 Apr 2012 13:10:49 +0900
parents
children
line wrap: on
line source

UTF-8 サポートについて
                nkf_utf8-2002.08.22 by furukawa@tcp-ip.or.jp


nkf-1.92 をベースに、UTF-8 対応してみました。

nkf を対応版に入れ換えるだけで、入力が UTF-8 ならば、
勝手に自動判別して、コード変換できることを目標としています。


従来の nkf と同様に、nkf -e として起動すると、自動判別で
UTF-8 と判定されれば、そのまま euc-jp に変換されます


オプションで、文字コードを指定することもできます。

    -w   出力を utf-8 に指定します
    -W   入力を utf-8 と仮定します

まだバグがある可能性が高いです。
(特に自動判別、コード混在、エラー処理系)

何か問題を見つけたら、furukawa@tcp-ip.or.jp まで御連絡を
お願いします。



その他、nkf-1.92 に対し、

  ・-Z3 オプションの新設
        X0208 の '>', '<', '”', '&'  をそれぞれ
        '&gt;', '&lt;', '&quot;', '&amp;' に変換します
  ・もともとの nkf 1.92 にあった、-Z1 オプションのバグ修正

という改造をしています。

<履歴>
2002.08.22
 * コンパイル時の warning への対処 (馬場さんのパッチによる)
 * utf-8 の判定のバグ修正
    正しい文字コードが来ているぶんには問題ありませんが、
    不正なコードが来ても、utf-8 モードから抜けない可能性が
    ありました
 * wvHtml の出力への対処 (北川文孝さんの御報告による)

-- 
Rei FURUKAWA 
furukawa@tcp-ip.or.jp