カボチャのファイルシステム

Question 1

...ファイルを抽出するには、すべてのアイテムを解凍する必要があります...そうですか？

tarを避ける場合はそうではありません。ファイル名を検索し、アーカイブから個々のファイルを抽出するのは簡単です（.zip、.7zの場合は高速）。はい。

> du -h a.*                     
223M    a                                        
115M    a.tar.gz                
75M     a.7z            

> 7z l a.7z | wc -l                     
2253  

> ( time 7z l a.7z >/dev/null ) 2>&1 | grep user                                            
user    0m0.014s

> ( time tar -ztf a.tar.gz >/dev/null ) 2>&1 | grep user
user    0m2.055s

...各ファイルを圧縮することは、すべてのファイルを1つのtarファイルに統合してから圧縮するのと同じくらい効果的ではありません。そうなんですか？

正しい。

最初のコメントは、7zはマルチスレッドでインデックス化されていますが、tar.xzはそうではないので、パフォーマンスに大きな違いがあるということです。

ただし、実際には圧縮にファイルシステムまたはデバイスマッパーのみを使用します。

vdo create --name=vdo_volume --device=/dev/vda

圧縮ファイルシステム https://en.m.wikipedia.org/wiki/Category:圧縮ファイルシステム例えば

mount -t btrfs  -o compress=lzo /dev/sdb /media/my_compressed_files

どちらもループバックデバイスで実行できるため、ファイル内のファイルシステム全体のように機能します。

データ検索速度は速いですが、書き込み性能が悪いヒューズ-7z-ngなどのいくつかのアーカイブヒューズドライバもあります。

fuse-7z-ng files.7z /media/my_compressed_files

Answer

...ファイルを抽出するには、すべてのアイテムを解凍する必要があります...そうですか？

tarを避ける場合はそうではありません。ファイル名を検索し、アーカイブから個々のファイルを抽出するのは簡単です（.zip、.7zの場合は高速）。はい。

> du -h a.*                     
223M    a                                        
115M    a.tar.gz                
75M     a.7z            

> 7z l a.7z | wc -l                     
2253  

> ( time 7z l a.7z >/dev/null ) 2>&1 | grep user                                            
user    0m0.014s

> ( time tar -ztf a.tar.gz >/dev/null ) 2>&1 | grep user
user    0m2.055s

...各ファイルを圧縮することは、すべてのファイルを1つのtarファイルに統合してから圧縮するのと同じくらい効果的ではありません。そうなんですか？

正しい。

最初のコメントは、7zはマルチスレッドでインデックス化されていますが、tar.xzはそうではないので、パフォーマンスに大きな違いがあるということです。

ただし、実際には圧縮にファイルシステムまたはデバイスマッパーのみを使用します。

vdo create --name=vdo_volume --device=/dev/vda

圧縮ファイルシステム https://en.m.wikipedia.org/wiki/Category:圧縮ファイルシステム例えば

mount -t btrfs  -o compress=lzo /dev/sdb /media/my_compressed_files

どちらもループバックデバイスで実行できるため、ファイル内のファイルシステム全体のように機能します。

データ検索速度は速いですが、書き込み性能が悪いヒューズ-7z-ngなどのいくつかのアーカイブヒューズドライバもあります。

fuse-7z-ng files.7z /media/my_compressed_files

Question 2

tarこのオプションを使用すると、-tvfgzip、bzip2、xzなどの他のライブラリと組み合わせて、tarで作成されたすべてのアーカイブの内容を一覧表示できます。

tar -tf file.tar
tar -ztf file.tar.gz
tar -jtf file.tar.bz2
tar -Jtf file.tar.xz

コンテンツを一覧表示すると、アーカイブから抽出するファイルを具体的に識別し、特定のパスを使用してファイルを抽出できます。

あなたのパスがだと仮定しますhome/user/old/photos/beach2012/bigbeachball.jpg。

tar -xf file.tar home/user/old/photos/beach2012/bigbeachball.jpg
tar -zxf file.tar.gz home/user/old/photos/beach2012/bigbeachball.jpg
tar -jxf file.tar.bz2 home/user/old/photos/beach2012/bigbeachball.jpg
tar -Jxf file.tar.xz home/user/old/photos/beach2012/bigbeachball.jpg

アーカイブがあまり変更されない場合（たとえば、ファイルを頻繁に追加または削除しない場合）、いつでもコンテンツをテキストファイルに抽出できます。 grepで検索できるテキストファイルにコンテンツを配置すると、検索するたびにアーカイブを処理するよりもファイルを見つけやすくなります。

Answer

tarこのオプションを使用すると、-tvfgzip、bzip2、xzなどの他のライブラリと組み合わせて、tarで作成されたすべてのアーカイブの内容を一覧表示できます。

tar -tf file.tar
tar -ztf file.tar.gz
tar -jtf file.tar.bz2
tar -Jtf file.tar.xz

コンテンツを一覧表示すると、アーカイブから抽出するファイルを具体的に識別し、特定のパスを使用してファイルを抽出できます。

あなたのパスがだと仮定しますhome/user/old/photos/beach2012/bigbeachball.jpg。

tar -xf file.tar home/user/old/photos/beach2012/bigbeachball.jpg
tar -zxf file.tar.gz home/user/old/photos/beach2012/bigbeachball.jpg
tar -jxf file.tar.bz2 home/user/old/photos/beach2012/bigbeachball.jpg
tar -Jxf file.tar.xz home/user/old/photos/beach2012/bigbeachball.jpg

アーカイブがあまり変更されない場合（たとえば、ファイルを頻繁に追加または削除しない場合）、いつでもコンテンツをテキストファイルに抽出できます。 grepで検索できるテキストファイルにコンテンツを配置すると、検索するたびにアーカイブを処理するよりもファイルを見つけやすくなります。

Question 3

私はこれに非常に興味があり、次のように私が調査したいくつかのオプションがあります。

カボチャのファイルシステム

スカッシュデータをアーカイブして圧縮できますが、後で圧縮されていないかのように移動できるように、ファイルシステムとしてマウントできます。

mksquashfs some/directory dir.squashfs
mkdir mnt
sudo mount -t squashfs dir.squashfs mnt

これはrootとしてのみ実行でき、Linuxでのみ実行できます。しかし、ヒューズを絞るFUSE対応システムでは、root以外のユーザーとしてこれを実行できます。

ピクセル

誰かがすでに言及しています。ピクセル- しかし、単にxzを並列化したわけではありません。またファイルインデックスアーカイブを圧縮して、小規模な作業をより効率的にします。たとえば、

# Listing files, and extracting a single file, using normal tar + xz
# So slow, not practical for interactive use.

$ time tar -tf 8gigs.tpxz > /dev/null
371.99s user 5.45s system 99% cpu 6:21.00 total
$ time tar -xf 8gigs.tpxz dir/somefile.txt
375.04s user 5.45s system 99% cpu 6:21.00 total

# Using pixz instead it's much faster!

$ time pixz -l < 8gigs.tpxz  > /dev/null
0.01s user 0.01s system 38% cpu 0.035 total
$ time pixz -x dir/somefile.txt < 8gigs.tpxz | tar x
0.33s user 0.02s system 97% cpu 0.359 total

婦人声明

私はpixzとsquashfuseを書きました。私にもあなたと同じ問題があったからです。

Answer

私はこれに非常に興味があり、次のように私が調査したいくつかのオプションがあります。

カボチャのファイルシステム

スカッシュデータをアーカイブして圧縮できますが、後で圧縮されていないかのように移動できるように、ファイルシステムとしてマウントできます。

mksquashfs some/directory dir.squashfs
mkdir mnt
sudo mount -t squashfs dir.squashfs mnt

これはrootとしてのみ実行でき、Linuxでのみ実行できます。しかし、ヒューズを絞るFUSE対応システムでは、root以外のユーザーとしてこれを実行できます。

ピクセル

誰かがすでに言及しています。ピクセル- しかし、単にxzを並列化したわけではありません。またファイルインデックスアーカイブを圧縮して、小規模な作業をより効率的にします。たとえば、

# Listing files, and extracting a single file, using normal tar + xz
# So slow, not practical for interactive use.

$ time tar -tf 8gigs.tpxz > /dev/null
371.99s user 5.45s system 99% cpu 6:21.00 total
$ time tar -xf 8gigs.tpxz dir/somefile.txt
375.04s user 5.45s system 99% cpu 6:21.00 total

# Using pixz instead it's much faster!

$ time pixz -l < 8gigs.tpxz  > /dev/null
0.01s user 0.01s system 38% cpu 0.035 total
$ time pixz -x dir/somefile.txt < 8gigs.tpxz | tar x
0.33s user 0.02s system 97% cpu 0.359 total

婦人声明

私はpixzとsquashfuseを書きました。私にもあなたと同じ問題があったからです。

カボチャのファイルシステム

答え1

答え2

答え3

カボチャのファイルシステム

ピクセル

婦人声明

関連情報