入力ファイルを一度解析して2つの別々のストリームに送信し、並べて表示する方法は？

Question 1

2つの項目を並べて表示するには、printfを使用してフォーマットされた印刷を実行できます。

#!/bin/bash
sort "$1" | uniq | while read line; do
    md5=$(md5sum <<< "$line")
    printf "%s %s\n" "$md5" "$line"
done 
times

Answer

2つの項目を並べて表示するには、printfを使用してフォーマットされた印刷を実行できます。

#!/bin/bash
sort "$1" | uniq | while read line; do
    md5=$(md5sum <<< "$line")
    printf "%s %s\n" "$md5" "$line"
done 
times

Question 2

複数のPerlメソッド：

Perlを使ってmd5sumを取得する

$ perl -ne 'BEGIN{  
                use Digest::MD5  qw(md5_hex)
            } 
            $k{$_}=md5_hex("$_"); 
            END{
                print "$k{$_} - $_" for sort keys(%k)
            }' file
5c2ce561e1e263695dbd267271b86fb8 - line 1
83e7cfc83e3d1f45a48d6a2d32b84d69 - line 2
0f2d633163ca585e5fc47a510e60f1ff - line 3
73bb3632fc91e9d1e1f7f0659da7ec5c - line 4
d82912361d84a675530f5e32aa6eeda1 - line 5

はい、一行です。

perl -ne 'BEGIN{use Digest::MD5  qw(md5_hex)} $k{$_}=md5_hex("$_"); END{print "$k{$_} - $_" for sort keys(%k)}' file

これはおそらくたくさんシェルでこれらの処理を実行するよりも高速です。

システムコールの使用

$ perl -lne 'chomp($md=`md5sum <<<"$_"`); print "$md $_" if !$seen{$_}++' file
83e7cfc83e3d1f45a48d6a2d32b84d69  - line 2
0f2d633163ca585e5fc47a510e60f1ff  - line 3
d82912361d84a675530f5e32aa6eeda1  - line 5
73bb3632fc91e9d1e1f7f0659da7ec5c  - line 4
5c2ce561e1e263695dbd267271b86fb8  - line 1

Answer

複数のPerlメソッド：

Perlを使ってmd5sumを取得する

$ perl -ne 'BEGIN{  
                use Digest::MD5  qw(md5_hex)
            } 
            $k{$_}=md5_hex("$_"); 
            END{
                print "$k{$_} - $_" for sort keys(%k)
            }' file
5c2ce561e1e263695dbd267271b86fb8 - line 1
83e7cfc83e3d1f45a48d6a2d32b84d69 - line 2
0f2d633163ca585e5fc47a510e60f1ff - line 3
73bb3632fc91e9d1e1f7f0659da7ec5c - line 4
d82912361d84a675530f5e32aa6eeda1 - line 5

はい、一行です。

perl -ne 'BEGIN{use Digest::MD5  qw(md5_hex)} $k{$_}=md5_hex("$_"); END{print "$k{$_} - $_" for sort keys(%k)}' file

これはおそらくたくさんシェルでこれらの処理を実行するよりも高速です。

システムコールの使用

$ perl -lne 'chomp($md=`md5sum <<<"$_"`); print "$md $_" if !$seen{$_}++' file
83e7cfc83e3d1f45a48d6a2d32b84d69  - line 2
0f2d633163ca585e5fc47a510e60f1ff  - line 3
d82912361d84a675530f5e32aa6eeda1  - line 5
73bb3632fc91e9d1e1f7f0659da7ec5c  - line 4
5c2ce561e1e263695dbd267271b86fb8  - line 1

Question 3

ループの実行に関してwhile read言及された問題がたくさんあります。シェルループを使用してテキストを処理するのはなぜ悪い習慣と見なされますか？

ここでは以下を使用しますperl。

sort -u < "$file" | perl -MDigest::MD5=md5_hex -lpe '
  $_ = md5_hex($_) . " - " . $_'

より一般的な質問は、次のように重複または変形しているようです。tee + cat：出力を複数回使用し、結果を連結します。

2つの行が同じに整列しているため（つまり、1sort -u行だけ保持されているため）、同じで同じMD5チェックサムを持ちます。LC_ALL=C sort -uバイト間比較に基づいて順序と一意性を使用できますstrcoll()。また、一部の実装では、長すぎる行、終了していない行、またはNUL文字を含む行を含むテキストではなく入力をブロックすることがsortあります。C

Answer

ループの実行に関してwhile read言及された問題がたくさんあります。シェルループを使用してテキストを処理するのはなぜ悪い習慣と見なされますか？

ここでは以下を使用しますperl。

sort -u < "$file" | perl -MDigest::MD5=md5_hex -lpe '
  $_ = md5_hex($_) . " - " . $_'

より一般的な質問は、次のように重複または変形しているようです。tee + cat：出力を複数回使用し、結果を連結します。

2つの行が同じに整列しているため（つまり、1sort -u行だけ保持されているため）、同じで同じMD5チェックサムを持ちます。LC_ALL=C sort -uバイト間比較に基づいて順序と一意性を使用できますstrcoll()。また、一部の実装では、長すぎる行、終了していない行、またはNUL文字を含む行を含むテキストではなく入力をブロックすることがsortあります。C

入力ファイルを一度解析して2つの別々のストリームに送信し、並べて表示する方法は？

答え1

答え2

答え3

関連情報