nkf(1) manページ

指定できるオプションは、以下の通り。 amp;-mu のように続けることができる。

-j amp;JIS コードを出力する。

-e amp;EUC コードを出力する。

-s Shift_JIS コードを出力する。

-w -w8[0] -w16[BL][0]

Unicode を出力する。

-w -w80	amp;UTF8 コードを出力する。 (BOM 無し)
-w8	amp;UTF8 コードを出力する。
-w16 -w16B0	amp;UTF16 コードを出力する。 (Big Endian / BOM 無し)
-w16B	amp;UTF16 コードを出力する。 (Big Endian / BOM 有り)
-w16L	amp;UTF16 コードを出力する。 (Little Endian / BOM 有り)
-w16L0	amp;UTF16 コードを出力する。 (Little Endian / BOM 無し)

-m[BQSN0]

amp;MIME を解読する。(デフォルト) amp;ISO-2022-JP (B encode) と ISO-8859-1 (Q encode) のみを解読する。 amp;ISO-8859-1 (Latin-1) を解読する時は、-l フラグも必要である。 amp;-m0 では MIME を解読しない。 amp;-mB, -mQ では、BASE64, Q encode されているものとして処理する。

-mB	amp;MIME base64 stream を解読する。ヘッダなどは取り除くこと。
-mQ	amp;MIME quoted stream を解読する。
-mS	amp;MIME のチェックを厳しくする (デフォルト)
-mN	amp;MIME のチェックを緩くする
-m0	amp;MIME を解読しない。

amp;-mS は、宣言の内容と、その後に続く encoded-text の整合性をチェックする。 amp;-mN は、改行で切られた MIME なども解読する。解読が止まらないこともある。

-M[BQ]

amp;MIME に変換する。

-M	ヘッダ形式に変換する
-MB	base64 stream に変換する
-MQ	Quoted stream に変換する

-J -E -S -W

期待される入力コードの性質を指定する。

-J	amp;ISO-2022-JP を仮定する。
-E	日本語 EUC (AT&T) を仮定する。
-S	Shift_JIS を仮定する。いわゆる半角カナ (JIS X 0201 片仮名) も受け入れる。
-W	amp;UTF-8 を仮定する。
-W8	amp;UTF-8 を仮定する。
-W16	amp;UTF-16 (Little Endian)を仮定する。
-W16B	amp;UTF-16 (Big Endian)を仮定する。
-W16L	amp;UTF-16 (Little Endian)を仮定する。

-x 通常おこなわれる、いわゆる半角カナ (JIS X 0201 片仮名) からいわゆる全角カナ (JIS X 0208 片仮名) への変換を行わず、半角カナを保存する。入力は、Shift_JIS の 1byte カナ、SO/SI、ESC-(-I, SSO を受け付ける。出力は、日本語 EUC 中では SSO、JIS コード中では ESC-(-I をデフォルトで用いる。

-X いわゆる半角カナ (JIS X 0201 片仮名) をいわゆる全角カナ (JIS X 0208 片仮名) へと変換する。

-B

壊れた (Broken) JIS コード。 amp;ESC がなくなったと仮定する。

-B1	amp;ESC-(, ESC-$ のあとのコードを問わない
-B2	改行のあとに強制的に ASCII に戻す

-f[m[-n]] 一行 m 文字になるように、マージンを n として簡単な整形をおこなう。デフォルトは文字数は 60、マージンは 10 である。

-Z[0-3]

amp;JIS X 0208 英数字と若干の記号を ASCII に変換する。つまり、全角を半角に変換する。

-Z -Z0	Convert X0208 alphabet to ASCII.
-Z1	amp;JIS X 0208 和字間隔を ASCII space 一つに変換する。
-Z2	amp;JIS X 0208 和字間隔を ASCII space 二つに変換する。
-Z3	＞、＜、”、＆、を >、<、"、& に変換する。

-b バッファリング出力を行う。(デフォルト)

-u 出力時に、バッファリングしない。 ssh localhost | nkf -u というように使う。

-t 何もしない。

-I amp;ISO-2022-JP 以外の漢字コードを〓に変換。

-i[@B]

amp;JIS 漢字を指示するシーケンスを指定する。

-i@	amp;JIS X 0208-1978 を用いる。
-iB	amp;JIS X 0208-1983/1990 を用いる。

-o[BJH]

1 バイト英数文字セットを指示するシーケンスを指定する。

-oB	1 バイト英数文字セットとして US-ASCII を用いる。
-oJ	1 バイト英数文字セットとして JIS X 0201 Roman を用いる。
-oH	amp;ESC ( H は初期の JUNET コードでのみ用いられたもので、現在は使ってはならない。

-r amp;ROT13/47 の変換をする。

-g 自動判別の結果を出力します。

-T テキストモードで出力する。(MS-DOS 上でのみ効力を持つ)

-l 0x80-0xfe のコードを ISO-8859-1 (Latin-1) として扱う。 amp;JIS コードアウトプットとの組合せみのみ有効。 amp;-s, -e, -x とは両立しない。

-O ファイルに出力する。 amp;UNIX では不要な機能だが Windows や MSDOS では必要らしい。直後の引き数でなく、最後のファイル名が出力ファイル名となり上書きされてしまうので注意。ファイル名がない場合は nkf.out。

-L[uwm] -d -c

改行コードを変換する。

-Lu -d	unix (LF)
-Lw -c	windows (CRLF)
-Lm	mac (CR)

デフォルトでは変換しない。

--ic=<input_codeset --oc=<output_codeset>>

入力・出力の漢字コード系を指定します。

ISO-2022-JP	いわゆる JIS コード。-j, -J と同じ。
ISO-2022-JP-1	amp;RFC 2237 に定められた形式。 JIS X 0212 を含む。
ISO-2022-JP-3	amp;RFC 2237 に定められた形式。 JIS X 0213 を含む。
EUC-JP	amp;EUC コード。-e, -E と同じ。
EUC-JISX0213	文字集合に JIS X 0213:2000 を用いた EUC-JP。
EUC-JIS-2004	文字集合に JIS X 0213:2004 を用いた EUC-JP。
eucJP-ascii	オープングループ日本ベンダ協議会が定義した eucJP-ascii。 amp;-x が暗黙のうちに指定される。
eucJP-ms	オープングループ日本ベンダ協議会が定義した euc-JPms。 amp;-x が暗黙のうちに指定される。
CP51932	Micorosft Code Page 51932。 amp;-x が暗黙のうちに指定される。
Shift_JIS	Shift_JIS。 amp;-s, -S と同じ。
Shift_JISX0213	文字集合に JIS X 0213:2000 を用いた Shift_JIS。
Shift_JIS-2004	文字集合に JIS X 0213:2004 を用いた Shift_JIS。
CP932	Micorosft Code Page 932。 amp;-x が暗黙のうちに指定される。
UTF-8 UTF-8N	amp;BOM 無しの UTF-8。 amp;-w, -W と同じ。
UTF-8-BOM	amp;BOM 付きの UTF-8。-w8 または -W と同じ。
UTF8-MAC	UTF8-MAC。互換分解されたひらがな・カタカナ等を結合します。入力のみの対応です。
UTF-16 UTF-16BE-BOM	amp;BOM 有りで Big Endian の UTF-16。 amp;-w16B, -W16B と同じ。
UTF-16BE	amp;BOM 無しで Big Endian の UTF-16。 amp;-w16B0. -W16B と同じ。
UTF-16LE-BOM	amp;BOM 有りで Little Endian の UTF-16。 amp;-w16L, -W16L と同じ。
UTF-16LE	amp;BOM 無しで Little Endian の UTF-16。 amp;-w16L0, -W16L と同じ。

--fj --unix --mac --msdos --windows これらのシステムに適した変換をします。

--jis --euc --sjis --mime --base64 対応する変換をします。

--hiragana --katakana 平仮名、片仮名変換

--fb-{skip, html, xml, perl, java, subchar} Unicode から Shift_JIS, EUC-JP, ISO-2022-JP に変換する際に、変換できなかった文字をどう扱うかを指定できます。

--prefix=escape charactertarget character..

EUC-JP から Shift_JIS への変換の際、2 バイト目に現れた文字の前にエスケープ文字をつけることができます。引数の 1 文字目がエスケープ文字、2 文字目以降にエスケープされるべき文字を指定します。

例えば、

amp;--prefix=\$@ とすると、Shift_JIS の 2 文字目に $ か @ が来たら、その前に \ が挿入されます amp;--prefix=@@ とすると、Shift_JIS の 2 文字目に @ が来たら、その前に @ が挿入されます

--no-cp932ext amp;CP932 において拡張された、NEC 特殊文字、NEC 選定 IBM 拡張文字 (89-92 区)、IBM 拡張文字を変換しません。

--no-best-fit-chars

Unicode からの変換の際に、往復安全性が確保されない文字の変換を行いません。 Unicode から Unicode の変換の際に -x と共に指定すると、nkf を UTF 形式の変換に用いることができます。 (逆に言えば、これを指定しないと一部の文字が保存されません)

パスに関わる文字列を変換する際には、このオプションを指定することを強く推奨します。

--cap-input, --url-input それぞれ :、% に続く 16 進数を文字に変換する

--numchar-input &#....; のような Unicode 文字参照を変換する

--in-place[=SUFFIX] --overwrite[=SUFFIX] 元のファイルを変換結果で置き換える。複数のファイルを書き換えることも可能。元のファイルのタイムスタンプとパーミッションが保持される。現在、作成日時や inode は変更されるが、将来にわたってこの実装のままである保証は無い。

--guess 自動判別の結果を出力する

--help コマンドの簡単な説明を表示する。

-V nkf の設定を表示する。

-v --version nkf のバージョンを表示する。

-- これ以降のオプションを無視する

--exec-in nkf [options] --exec-in cmd args... とやると、cmd の出力を nkf の入力とする (config.h で EXEC_IO を define してコンパイルした時のみ有効)

--exec-out nkf [options] --exec-out cmd args... とやると、nkf の出力を cmd の入力とする (config.h で EXEC_IO を define してコンパイルした時のみ有効)

河野真治
Akio Furukawa
Andy Taki
From: OHARA Shigeki
Fumitaka Kitagawa
Hiroaki Sengoku
Ikuhiro MORITA (森田育宏)
Yoshiharu ITO
Junn Ohta
KAWAMURA Masao
Kazuhiko Mori
Keitaro Isokawa
Ken-ichi Hirose
Ki-ichiro SATO
Kiwamu Aoyama
Koichi Hirayama
Mitsuru Hase (長谷　満)
OHARA Shigeki (大原重樹)
Rei FURUKAWA
Satoru Takabayashi
Shigeyuki Takagi
Shin MICHIMUKO
Tadamasa Teranishi
TOYODA Jiro
TSUCHIYA Masatoshi
Tsutomu Sakai
YAMASHITA Junji (山下純司)
Yasuyuki Sato
Yoshiaki Yanagihara
hat@so-net
ＤＣＣ技術部渡辺
かとぺ / 加藤貴司
かべdais
ひろせまさあき
イントラネットシステム(株)松尾
鵜飼文敏
塩崎毅彦(SHIOZAKI Takehiko)
河村雅夫 (Media Lab.)
河野康司
喜瀬“冬猫”浩＠南国沖縄
金井智彦
桂田祐史 (かつらだまさし)
高橋宜盟
国吉
黒江明彦
三宅正泰
山倉真
山本芳人
山野裕司 (やまのゆうじ)
重村法克
小島基靖
上田　健
新井康司 (Koji Arai)
森　千絵子
森　和彦
水野貴文
前地和俊
仲宗根＠並列信頼研
猪谷英一郎 == Eiichiro Itani
藤原　秀行
八田真行 (Masayuki Hatta)
尾川敏也
望月孝志
木村 (＠筑波大学数学研究科)
野村俊彰
有岡＠ミノルタ
有沢明宏
落合一喜
林亮
國安治
木下雄介
田中隆裕
鶴谷直樹
中田伸悦
わたなべひろふみ
MoonWolf
sava

市川至 ichikawa@flab.fujitsu.co.jp (was ichikawa@fujitsu.JUNET)
河野真治 kono@ie.u-ryukyu.acjp
Rei FURUKAWA furukawa@tcp-ip.or.jp
成瀬
mastodon

manページ — nkf

NAME

内容

SYNOPSIS

DESCRIPTION

OPTIONS

BUGS

ACKNOWLEDGE

AUTHOR