view nkf-utf8/Changes @ 12:441a2190cfae

Lion fix
author Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date Sat, 21 Apr 2012 13:10:49 +0900
parents
children
line wrap: on
line source

2003-09-28 Shinji KONO

b encoded ISO-8859-1 MIME

MIME のencoding を信用するようにした方がいいかも...

2002-10-06  Rei FURUKAWA  <furukawa@tcp-ip.or.jp>

	* INSTALL, INSTALL.j, make_test.pl を追加

2002-10-04  Rei FURUKAWA  <furukawa@tcp-ip.or.jp>

	* 入力文字コードが確定する前に h_conv を抜ける場合の
	判定精度を上げた

2002-09-29  Rei FURUKAWA  <furukawa@tcp-ip.or.jp>

	* デフォルトの出力コード選択を config.h に移動
	* SunOS の cc でコンパイルできるようにした
	* -OW をやめて、代わりに --overwrite にした
	* [sw]_iconv から変換部分を別関数に分離した



Date: Thu Sep 26 23:12:03 JST 2002

SourceForge のCVSに登録しました。

cvs -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/nkf login 

cvs -z3 -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/nkf co nkf-2

Subject: Re: nkf 2.0
From:    kono@ie.u-ryukyu.ac.jp (Shinji KONO)
Date:    Tue, 24 Sep 2002 23:18:54 +0900
Content-ID: <5196.1032877134.1@insigna.ie.u-ryukyu.ac.jp>

河野 真治@琉球大情報工学です。

utf のtable のチェックだけど、やっぱり、落ちまくるので、
一通り、直しました。変なコードの入っている文書は結構多い...

ついでにUTF16も付けました。
    -W16 -w16
みたいにしました。
自動検出はしないけどね。

なんか、Mac OS XのiCal がUTF16を要求するので...
これはiCalのバグでしょうね。


Subject: nkf 2.0
From:    Rei FURUKAWA <furukawa@tcp-ip.or.jp>
Date:    Mon, 16 Sep 2002 06:47:39 +0900

古川です。

河野さんの 2.0 に、こちらでの変更点をマージしました。

http://www01.tcp-ip.or.jp/~furukawa/nkf-utf8/nkf_utf8-2002.09.15.tar.bz2

バグ修正も含むので、是非見ていただけたら、と思います。


2.0 からの変更点は、以下の通りです。

[1] 仕様の有効/無効を切り替える #define を、nkf.c の中ではなく、
 config.h に置くようにしました


[2] UTF8_SUPPORT を UTF8_INPUT_ENABLE と UTF8_OUTPUT_ENABLE に
分けました。これにより、utf-8 出力機能の不要な人は、そちらだけ
を無効にすることができます。


[3] 入力文字コードをオプションで指定した場合には、そのコード
から全く遷移しないようにしました。

v1.92 では、-S などを指定していても、途中で自動判定に戻ること
がありましたが、それを止めました。


[4] 先日の河野さんの、
kono> hconv の中で、igetcしちゃってるみたいだけど、そうすると、
kono> そのigetcに JISの最初のESCが、あったりすると、困るんだよね。

という御指摘に従い、h_conv で ESC を見つけたら、ループから抜ける
ようにしました。


[5] --cap-input, --url-input オプションを新設しました。これにより、
    http://google.com/search?q=%8C%9F%8D%F5
といった入力から
    http://google.com/search?q=検索
を出力するようなことができます。


[6] --no-output, --debug オプション
主にチェック用ですが、2 つ組み合わせると、
    % nkf --no-output --debug hogehoge.txt
    Shift_JIS
のように判定した文字コードが stderr に表示されます。


[7] utf8tbl.c の修正
初期の頃のテーブルには、いくつかの記号で不具合がありました。
こちらでの修正を反映させました。


[8] ロングオプションのバグを修正しました。これは、先日もお伝え
しました通りです。


[9] LSC-C 試食版での動作確認をしました。その際、コンパイルが通ら
なかった部分があったので、修正しました。 (試食版では UTF8 は使え
ませんが)

また、MS-DOS でも OVERWRITE が 動くようにしました。


[10] OVERWRITE のテンポラリファイルを元ファイルと同じディレクトリ
に作るようにしました。

カレントディレクトリに作った場合、
    ファイルシステムをまたぐ rename になる可能性がある
    カレントディレクトリが書き込み禁止だとオープンできない
のが理由です。


-------------------------------------------------------------
それと、2.0 についていくつか思ったことがあります。

[1] 2.0 では -OW で overwrite となっていますが、これはあまり
よくないように思います。

それは、他の文字コードの -OE, -OS などは、「-O と -E (-S)」と
いう意味で使えるのに、-OW だけが「上書き」になってしまうのは、
直交性という点で混乱しそうだからです。

私としては、-R のような別の文字を使うか、または、--overwrite
や --replace のようにロングオプションだけにしてしまうほうが、
不意に元ファイルを書き換えてしまう危険が少ないと思います。


[2] nkf.shar では、あらかじめ NKF.mod/ を作っておかないと、
エラーになってしまいます。まず mkdir するようになっていた方が
よいのではないかと思います。

具体的な修正方法は、私には分かりません。すみません。


[3] アーカイブの中に NKF.mod/Makefile が含まれていますが、これ
は、一般的な環境では必要ないと思います。


-- 
Rei FURUKAWA 
furukawa@tcp-ip.or.jp


Subject: Re: nkf 1.9 MIME-Q decode
From:    kohno@mercury.nikon.co.jp
Date:    Tue, 10 Sep 2002 11:49:48 +0900 (JST)

 河野@ニコンです。

> Message-ID: <5075.1031469723@insigna.ie.u-ryukyu.ac.jp>, kono@insigna.ie.u-ry
ukyu.ac.jp wrote
> > nkf 1.9.2 の Q-decode のことについて教えてください。
> ようやっと直した版を作りました。

 ありがとうございます。
# ver 2.0 になったんですね。

> 時間があればチェックしてみて下さい。

 とりあえずコンパイルして、以前うまくいかなかった '?=3D' を
確かめました。

 当方には(まだ)SunOS4 のマシンが2台あるので、こちらでも
コンパイルしてみました。
 以下のパッチをあてるとコンパイルできますので、
お礼を兼ねてご報告とさせていただきます。

# このパッチで HP/UX 10.20, 11.00 の OS 付属の cc でコンパイルできました。



Subject: nkf + utf8
From:    Rei FURUKAWA <furukawa@tcp-ip.or.jp>
Date:    Wed, 21 Aug 2002 03:53:15 +0900

Namazu project の古川と申します。

# 以前 (2000 年 12 月)、nkf 1.92 のバグ報告をした者です。

namazu ML で、「utf-8 のファイルを検索できないか」という話題が
出て、

    nkf が utf-8 を euc-jp に変換できるようになれば、入れ換え
    るだけで (Namazu 側で何もしなくても) 自然と扱えるようにな
    る (もちろん、日本語限定ですが)

と思い、試しに nkf を utf-8 対応にしてみました。

    http://www01.tcp-ip.or.jp/~furukawa/nkf_utf8/

に置いています。utf-8 のファイルを入力すると、自動判別して変換
できるようになっています。(utf-7 や utf-16 などには対応してい
ません)