next up previous
: この文書について... : 情報処理II 第7回 情報の電子化 (3) : データ・フォーマットの選択についての注意事項 文書を例として

データの圧縮用コマンド

UNIX では、可逆な圧縮をするための一般的なコマンドとして、compress, gzip, bzip2 などがある。compress は以前はよく使われたが、やはり特許の 問題であまり使われなくなってきた。最近は gzip が良く使われている。
waltz12% cd filter
waltz12% cp alice29.txt alice29.doc
waltz12% gzip alice29.doc ← 圧縮する
waltz12% ls -l alice* alice29.doc の代りに alice29.doc.gz という
 小さなファイルが出来る
waltz12% wc alice* ← ファイルのサイズを調べる。
waltz12% gzip -d alice29.doc.gz → 復元する。
waltz12% ls -l alice* alice29.doc.gz が無くなり、 alice29.doc が現れる。
waltz12% diff alice29.doc alice29.txt ← 変化がないかチェックする (変化はないはず)。

英文テキスト・ファイルなどでは 1/3 程度までにサイズが小さくなる。 また gzip -d で decompress (圧縮の復元) すると、完全に元に戻る。

Windows などでは、複数のファイルを一つにまとめてから圧縮をするコマンド が普及している (Lha, WinZip, Cab, ...)。


next up previous
: この文書について... : 情報処理II 第7回 情報の電子化 (3) : データ・フォーマットの選択についての注意事項 文書を例として
Masashi Katsurada 平成12年6月22日