
重複排除の使用を検討しているパーティションがあります。
データプロファイルの場合、これは良い選択になると思います。しかし、その前に単純な「感情」ではなく、より体系的に影響を評価してみたいと思います。
重複排除がパーティションに与える影響を評価するためのツールはありますか? (ファイルレベルまたはブロックレベル)。
現在私はubuntuとext4を使用していますが、この場合、重複排除が役に立つと判断した場合は、openupまたはlessfsの使用を検討しています。他のディストリビューション/無料* nixを使用している場合でも、他の提案があります。
答え1
どのファイルシステムが指定されていません。 ZFSについて話している場合は、zdbコマンドを使用して重複排除機能をオンにすると、どのような結果が出るのかを確認できます。
# zdb -S tank
Simulated DDT histogram:
bucket allocated referenced
______ ______________________________ ______________________________
refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE
------ ------ ----- ----- ----- ------ ----- ----- -----
1 775 96.8M 96.8M 96.8M 775 96.8M 96.8M 96.8M
2 2 256K 256K 256K 6 768K 768K 768K
4 3 384K 384K 384K 13 1.62M 1.62M 1.62M
128 1 128K 128K 128K 158 19.8M 19.8M 19.8M
Total 781 97.5M 97.5M 97.5M 952 119M 119M 119M
dedup = 1.22, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.22