-j
|
amp;JIS コードを出力する。
|
-e
|
amp;EUC コードを出力する。
|
-s
|
Shift_JIS コードを出力する。
|
-w -w8[0] -w16[BL][0]
|
Unicode を出力する。
-w -w80
|
amp;UTF8 コードを出力する。 (BOM 無し)
|
-w8
|
amp;UTF8 コードを出力する。
|
-w16 -w16B0
|
amp;UTF16 コードを出力する。 (Big Endian / BOM 無し)
|
-w16B
|
amp;UTF16 コードを出力する。 (Big Endian / BOM 有り)
|
-w16L
|
amp;UTF16 コードを出力する。 (Little Endian / BOM 有り)
|
-w16L0
|
amp;UTF16 コードを出力する。 (Little Endian / BOM 無し)
|
|
-m[BQSN0]
|
amp;MIME を解読する。(デフォルト)
amp;ISO-2022-JP (B encode) と ISO-8859-1 (Q encode) のみを解読する。
amp;ISO-8859-1 (Latin-1) を解読する時は、-l フラグも必要である。
amp;-m0 では MIME を解読しない。
amp;-mB, -mQ では、BASE64, Q encode されているものとして処理する。
-mB
|
amp;MIME base64 stream を解読する。
ヘッダなどは取り除くこと。
|
-mQ
|
amp;MIME quoted stream を解読する。
|
-mS
|
amp;MIME のチェックを厳しくする (デフォルト)
|
-mN
|
amp;MIME のチェックを緩くする
|
-m0
|
amp;MIME を解読しない。
|
amp;-mS は、宣言の内容と、その後に続く encoded-text の整合性をチェックする。
amp;-mN は、改行で切られた MIME なども解読する。解読が止まらないこともある。
|
-M[BQ]
|
amp;MIME に変換する。
-M
|
ヘッダ形式に変換する
|
-MB
|
base64 stream に変換する
|
-MQ
|
Quoted stream に変換する
|
|
-J -E -S -W
|
期待される入力コードの性質を指定する。
-J
|
amp;ISO-2022-JP を仮定する。
|
-E
|
日本語 EUC (AT&T) を仮定する。
|
-S
|
Shift_JIS を仮定する。
いわゆる半角カナ (JIS X 0201 片仮名) も受け入れる。
|
-W
|
amp;UTF-8 を仮定する。
|
-W8
|
amp;UTF-8 を仮定する。
|
-W16
|
amp;UTF-16 (Little Endian)を仮定する。
|
-W16B
|
amp;UTF-16 (Big Endian)を仮定する。
|
-W16L
|
amp;UTF-16 (Little Endian)を仮定する。
|
|
-x
|
通常おこなわれる、いわゆる半角カナ (JIS X 0201 片仮名)
からいわゆる全角カナ (JIS X 0208 片仮名) への変換を行わず、半角カナを保存する。
入力は、Shift_JIS の 1byte カナ、SO/SI、ESC-(-I, SSO を受け付ける。
出力は、日本語 EUC 中では SSO、JIS コード中では ESC-(-I をデフォルトで用いる。
|
-X
|
いわゆる半角カナ (JIS X 0201 片仮名) を いわゆる全角カナ (JIS X 0208 片仮名) へと変換する。
|
-B
|
壊れた (Broken) JIS コード。
amp;ESC がなくなったと仮定する。
-B1
|
amp;ESC-(, ESC-$ のあとのコードを問わない
|
-B2
|
改行のあとに強制的に ASCII に戻す
|
|
-f[m[-n]]
|
一行 m 文字になるように、マージンを n として簡単な整形をおこなう。
デフォルトは文字数は 60、マージンは 10 である。
|
-Z[0-3]
|
amp;JIS X 0208 英数字と若干の記号を ASCII に変換する。
つまり、全角を半角に変換する。
-Z -Z0
|
Convert X0208 alphabet to ASCII.
|
-Z1
|
amp;JIS X 0208 和字間隔を ASCII space 一つに変換する。
|
-Z2
|
amp;JIS X 0208 和字間隔を ASCII space 二つに変換する。
|
-Z3
|
>、<、”、&、を >、<、"、& に変換する。
|
|
-b
|
バッファリング出力を行う。(デフォルト)
|
-u
|
出力時に、バッファリングしない。
ssh localhost | nkf -u というように使う。
|
-t
|
何もしない。
|
-I
|
amp;ISO-2022-JP 以外の漢字コードを〓に変換。
|
-i[@B]
|
amp;JIS 漢字を指示するシーケンスを指定する。
-i@
|
amp;JIS X 0208-1978 を用いる。
|
-iB
|
amp;JIS X 0208-1983/1990 を用いる。
|
|
-o[BJH]
|
1 バイト英数文字セットを指示するシーケンスを指定する。
-oB
|
1 バイト英数文字セットとして US-ASCII を用いる。
|
-oJ
|
1 バイト英数文字セットとして JIS X 0201 Roman を用いる。
|
-oH
|
amp;ESC ( H は初期の JUNET コードでのみ用いられたもので、現在は使ってはならない。
|
|
-r
|
amp;ROT13/47 の変換をする。
|
-g
|
自動判別の結果を出力します。
|
-T
|
テキストモードで出力する。(MS-DOS 上でのみ効力を持つ)
|
-l
|
0x80-0xfe のコードを ISO-8859-1 (Latin-1) として扱う。
amp;JIS コードアウトプットとの組合せみのみ有効。
amp;-s, -e, -x とは両立しない。
|
-O
|
ファイルに出力する。
amp;UNIX では不要な機能だが Windows や MSDOS では必要らしい。
直後の引き数でなく、最後のファイル名が出力ファイル名となり上書きされてしまうので注意。
ファイル名がない場合は nkf.out。
|
-L[uwm] -d -c
|
改行コードを変換する。
-Lu -d
|
unix (LF)
|
-Lw -c
|
windows (CRLF)
|
-Lm
|
mac (CR)
|
デフォルトでは変換しない。
|
--ic=<input_codeset --oc=<output_codeset>>
|
入力・出力の漢字コード系を指定します。
ISO-2022-JP
|
いわゆる JIS コード。-j, -J と同じ。
|
ISO-2022-JP-1
|
amp;RFC 2237 に定められた形式。 JIS X 0212 を含む。
|
ISO-2022-JP-3
|
amp;RFC 2237 に定められた形式。 JIS X 0213 を含む。
|
EUC-JP
|
amp;EUC コード。-e, -E と同じ。
|
EUC-JISX0213
|
文字集合に JIS X 0213:2000 を用いた EUC-JP。
|
EUC-JIS-2004
|
文字集合に JIS X 0213:2004 を用いた EUC-JP。
|
eucJP-ascii
|
オープングループ日本ベンダ協議会が定義した eucJP-ascii。
amp;-x が暗黙のうちに指定される。
|
eucJP-ms
|
オープングループ日本ベンダ協議会が定義した euc-JPms。
amp;-x が暗黙のうちに指定される。
|
CP51932
|
Micorosft Code Page 51932。
amp;-x が暗黙のうちに指定される。
|
Shift_JIS
|
Shift_JIS。
amp;-s, -S と同じ。
|
Shift_JISX0213
|
文字集合に JIS X 0213:2000 を用いた Shift_JIS。
|
Shift_JIS-2004
|
文字集合に JIS X 0213:2004 を用いた Shift_JIS。
|
CP932
|
Micorosft Code Page 932。
amp;-x が暗黙のうちに指定される。
|
UTF-8 UTF-8N
|
amp;BOM 無しの UTF-8。
amp;-w, -W と同じ。
|
UTF-8-BOM
|
amp;BOM 付きの UTF-8。-w8 または -W と同じ。
|
UTF8-MAC
|
UTF8-MAC。互換分解されたひらがな・カタカナ等を結合します。
入力のみの対応です。
|
UTF-16 UTF-16BE-BOM
|
amp;BOM 有りで Big Endian の UTF-16。
amp;-w16B, -W16B と同じ。
|
UTF-16BE
|
amp;BOM 無しで Big Endian の UTF-16。
amp;-w16B0. -W16B と同じ。
|
UTF-16LE-BOM
|
amp;BOM 有りで Little Endian の UTF-16。
amp;-w16L, -W16L と同じ。
|
UTF-16LE
|
amp;BOM 無しで Little Endian の UTF-16。
amp;-w16L0, -W16L と同じ。
|
|
--fj --unix --mac --msdos --windows
|
これらのシステムに適した変換をします。
|
--jis --euc --sjis --mime --base64
|
対応する変換をします。
|
--hiragana --katakana
|
平仮名、片仮名変換
|
--fb-{skip, html, xml, perl, java, subchar}
|
Unicode から Shift_JIS, EUC-JP, ISO-2022-JP に変換する際に、変換できなかった文字をどう扱うかを指定できます。
|
--prefix=escape charactertarget character..
|
EUC-JP から Shift_JIS への変換の際、2 バイト目
に現れた文字の前にエスケープ文字をつけることができます。
引数の 1 文字目がエスケープ文字、2 文字目以降にエスケープされるべき文字を指定します。
例えば、
amp;--prefix=\$@ とすると、Shift_JIS の 2 文字目に $ か @ が来たら、その前に \ が挿入されます
amp;--prefix=@@ とすると、Shift_JIS の 2 文字目に @ が来たら、その前に @ が挿入されます
|
--no-cp932ext
|
amp;CP932 において拡張された、NEC 特殊文字、NEC 選定 IBM 拡張文字 (89-92 区)、IBM 拡張文字を変換しません。
|
--no-best-fit-chars
|
Unicode からの変換の際に、往復安全性が確保されない文字の変換を行いません。
Unicode から Unicode の変換の際に -x と共に指定すると、nkf を UTF 形式の変換に用いることができます。
(逆に言えば、これを指定しないと一部の文字が保存されません)
パスに関わる文字列を変換する際には、このオプションを指定することを強く推奨します。
|
--cap-input, --url-input
|
それぞれ :、% に続く 16 進数を文字に変換する
|
--numchar-input
|
&#....; のような Unicode 文字参照を変換する
|
--in-place[=SUFFIX] --overwrite[=SUFFIX]
|
元のファイルを変換結果で置き換える。
複数のファイルを書き換えることも可能。
元のファイルのタイムスタンプとパーミッションが保持される。
現在、作成日時や inode は変更されるが、将来にわたってこの実装のままである保証は無い。
|
--guess
|
自動判別の結果を出力する
|
--help
|
コマンドの簡単な説明を表示する。
|
-V
|
nkf の設定を表示する。
|
-v --version
|
nkf のバージョンを表示する。
|
--
|
これ以降のオプションを無視する
|
--exec-in
|
nkf [options] --exec-in cmd args... とやると、cmd の出力を nkf の入力とする
(config.h で EXEC_IO を define してコンパイルした時のみ有効)
|
--exec-out
|
nkf [options] --exec-out cmd args... とやると、nkf の出力を cmd の入力とする
(config.h で EXEC_IO を define してコンパイルした時のみ有効)
|