bunzip2(1) manページ

bzip2 は Burrows-Wheeler ブロックソーティングテキスト圧縮アルゴリズムと Huffman 符号を使ってファイルを圧縮します。圧縮率は大抵、より一般的な LZ77/LZ78 をベースとした圧縮器より大変良く、性能は統計的圧縮器の PPM ファミリに迫っています。

コマンドラインオプションは意図的に GNU gzip のものに似せてありますが、同一ではありません。

bzip2 はコマンドラインフラグを伴ったファイル名のリストを受け取ります。各ファイルは "original_name.bz2" という名前の圧縮済みファイルで置き換えられます。圧縮された各ファイルは、元のファイルと同じ更新時刻およびパーミッションを持ち、そして可能なら同じ所有者となります。これによりこれらの属性は伸長時に正しく復元可能となります。ファイル名の扱いは単純で、元ファイルの名前、パーミッション、所有者、日付の概念が無いファイルシステムや、 MS-DOS のようにファイル名の長さに大きな制限があるファイルシステムでは、それらを保存する機構はありません。

bzip2 と bunzip2 は、デフォルトでは既存のファイルを上書きしません。上書きしたい場合は -f フラグを指定してください。

ファイル名が指定されない場合、 bzip2 は標準入力を圧縮して標準出力へ書き出します。この場合 bzip2 は圧縮された結果を端末へ書き出しません。それは全く読むことができず、出力することは無意味だからです。

bunzip2 (または bzip2 -d) は指定されたすべてのファイルを伸長します。 bzip2 で生成されたのではないファイルを検知・無視し、さらに警告を発します。 bzip2 は以下のようにして圧縮済みファイルの名前から伸長後のファイル名を推測します:

filename.bz2 は filename とします
filename.bz は filename とします
filename.tbz2 は filename.tar とします
filename.tbz は filename.tar とします
anyothername は anyothername.out とします

ファイル名が .bz2, .bz, .tbz2 または .tbz のような、認識できる名前で終わっていない場合、 bzip2 は元のファイル名が推測できない旨を通知して .out を付加した名前を元のファイル名として使います。

圧縮の場合と同様に、ファイル名が指定されない場合は標準入力を伸長して標準出力へ書き出します。

bunzip2 は 2 つ以上の圧縮済みファイルを連結したファイルを正しく伸長します。得られるファイルは、伸長後のファイルを連結したものです。連結した圧縮ファイルに対しても健全性のテスト (-t) がサポートされています。

-c フラグを与えることで、ファイルを圧縮または伸長した結果を標準出力へ書き出すことができます。このフラグを与えて、複数のファイルを圧縮または伸長することができます。結果は標準出力へ順番に書き出されます。この方式による複数ファイルの圧縮では、複数の圧縮ファイルからなるストリームが生成されます。このストリームは、バージョン 0.9.0 以降の bzip2 でしか正しく伸長できません。これより前のバージョンの bzip2 では、ストリーム中の最初のファイルを伸長した後に停止します。

bzcat (または bzip2 -dc) は指定された全てのファイルを伸長し、標準出力に書き出します。

bzip2 は引数として環境変数 BZIP2 と BZIP を順番に読み、コマンドラインから読んだ引数より先に処理します。これはデフォルトの引数を与えるのに便利です。

圧縮後のファイルが元のファイルよりも少し大きくなる場合でも、常に圧縮は行われます。圧縮機構には常に 50 バイトのオーバヘッドがあるので、約 100 バイトよりも小さなファイルは大きくなる傾向があります。ランダムなデータ (ほとんどのファイル圧縮器の出力も) は 1 バイト当たり約 8.05 ビットで符号化され、約 0.5% 大きくなります。

保護のための自己チェックとして、 bzip2 は、伸長後のファイルと元のファイルとの同一性を確かめるために 32 ビット CRC を使います。これにより、圧縮済みデータの破損や bzip2 のまだ見つかっていないバグ (ほとんど無いはすです) から守ります。データの破壊が検出できない確率は極めて小さく、各ファイルの処理 40 億回あたり 1 回程度です。ただし、このチェックは伸長の時にしか行われず、したがって何か間違いが発生したことしか分かりません。圧縮前の元データを復元するのには役に立ちません。破損したファイルからデータを復元するのに bzip2recover を試みることはできます。

戻り値: 正常終了の場合は 0 が返されます。実行環境の問題 (ファイルが見つからない、無効なフラグ、入出力エラーなど) の場合は 1 が戻ります。圧縮ファイルが破損している場合は 2 が戻ります。 bzip2 にパニックを引き起こす内部整合性エラー (例えばバグ) の場合は 3 が戻ります。

-c --stdout
	圧縮または伸長した結果を標準出力に書き出します。
-d --decompress
	伸長を強制します。 bzip2, bunzip2, bzcat は実際には同じプログラムで、どの動作をするのかは、どの名前が使われたかに基づいて決められます。このフラグはそれよりも優先され、 bzip2 に伸長を強制させます。
-z --compress
	-d の反対: 起動時の名前にかかわらず、圧縮を強制します。
-t --test
	指定されたファイルの健全性チェックをしますが、伸長はしません。実際には伸長を試み、その結果は捨てています。
-f --force
	出力ファイルの上書きを強制します。通常 bzip2 は既存の出力ファイルを上書きしません。さらに bzip2 にファイルへのハードリンクを切断させます。このオプションが指定されていない場合は、ハードリンクの切断はされません。 bzip2 は通常、正しいマジックヘッダバイトを持たないファイルの伸長を拒否します。強制 (-f) すると、そのようなファイルを修正せずにそのまま通過させます。これは GNU gzip の動作と同じです。
-k --keep
	圧縮または伸長後でも入力ファイルを保存します (削除しません)。
-s --small
	圧縮、伸長、テストの際のメモリ使用量を減らします。ブロックバイトあたり 2.5 バイトしか必要としないように変更されたアルゴリズムを使って、ファイルの伸長やテストが行われます。全てのファイルが 2300k のメモリで伸長できますが、通常の約半分の速度になってしまいます。圧縮時に -s を使うと 200k のブロックサイズが選択されます。メモリ使用量はほぼ同じ大きさに制限されますが、圧縮率が犠牲になります。つまり、マシンに搭載されているメモリが少なければ (8 メガバイト以下) つねに -s フラグを使ってください。後述するメモリ管理の項目を参照してください。
-q --quiet
	本質的でない警告メッセージは出力しません。入出力エラーと致命的なイベントに関連するメッセージは出力されます。
-v --verbose
	詳細表示モードです。処理されたファイル毎に圧縮率を表示します。さらに -v を与えると詳細表示のレベルが上がり、主に診断を目的とする多くの情報が出力されます。
-L --license -V --version
	ソフトウェアのバージョン、ライセンス条項とその条件が表示されます。
-1 (または --fast) から -9 (または --best)
	圧縮時のブロックサイズを 100 k, 200 k .. 900 k に設定します。伸長時には何も影響がありません。下のメモリ管理の項目を参照してください。 --fast と --best という別名は、第一義的には GNU gzip との互換性のためです。特に、--fast は非常に高速になるわけではありません。また、--best は単にデフォルト動作を選択するだけです。
--	これ以降の引数についてはダッシュで始まるものでもファイル名として扱われます。これによりダッシュで始まるファイル名も扱うことができます。例えば次のように使います: bzip2 -- -myfilename
--repetitive-fast --repetitive-best
	これらのフラグは、バージョン 0.9.5 以降では冗長です。これらは以前のバージョンで整列アルゴリズムの動作を大雑把に制御するために提供されたもので、時々は役立っていたものでした。 0.9.5 以降でこれらのフラグが無関係になる改良されたアルゴリズムが使われています。

manページ — bzip2

名称

内容

書式

解説

オプション

メモリ管理

破損したファイルからデータを復元する

性能に関する注釈

警告

作者