フォルダ内には次の内容がありますHadoopバイナリファイルとそのサイズ(BYTES)
du -sb * | grep HADOOP[a-z]
334542327 HADOOPaa
334542327 HADOOPab
334542327 HADOOPac
334542327 HADOOPad
334542327 HADOOPae
334542327 HADOOPaf
334542327 HADOOPag
334542327 HADOOPah
334542327 HADOOPai
334542327 HADOOPaj
334542327 HADOOPak
334542327 HADOOPal
334542327 HADOOPam
334542327 HADOOPan
334542327 HADOOPao
334542327 HADOOPap
334542327 HADOOPaq
334542327 HADOOPar
334542327 HADOOPas
334542327 HADOOPat
334542327 HADOOPau
334542327 HADOOPav
334542327 HADOOPaw
334542327 HADOOPax
334542327 HADOOPay
334542327 HADOOPaz
334542327 HADOOPba
334542327 HADOOPbb
932542327 HADOOPbc
334542327 HADOOPbd
334542327 HADOOPbe
434542327 HADOOPbf
934542327 HADOOPbg
108883803 HADOOPbh
awkを使用すると、すべての数値をフルサイズ(バイト)に正常に追加できます。
はい
du -sb * | grep HADOOP[a-z] | awk '{ sum+=$1} END {print sum}'
今、私はmd5を使って同じことをしたいと思います。
私たちは努力する
md5sum * | grep HADOOP[a-z] | md5sum | awk '{print $1}'
2a85626137ae7d689b85e8e04e8a2523 -
しかし、私たちはちょうどすべてのmd5ファイルの合計を望んでいるので、それほどクールでもエレガントでもありません(左sideは、HADOOP [az]に一致する各ファイルのmd5です。
どんな提案がありますか?
答え1
ここで何をしたいのかわかりませんが...後で合計を印刷したいようですawk
(または)。しかし、チェックサムを使用してすべてのファイルがあるかどうかを確認しますか?これはあなたが望む最終結果ですか?cut
grep
ところで、私はglobがランダムな順序を返すことをほとんど確信しているので、毎回同じで複数のコンピュータで繰り返し可能であることを確認するためにどこかで1つを使用したいmd5sum *
と思います。sort