私はsort -u
これまで重複を排除するためにこれを使用してきました。
ただし、ソフトウェアツールで生成されたリストに問題があります。
問題は次のとおりです。の出力はsort -u |wc
何ですかuniq -u |wc
?
なぜなら、同じ結果が出ないからです。このマニュアルでは、以下をuniq
指定します。
-u, --unique 一意の行のみを印刷
私の出力は1110語で構成されており、そのうちsort -u
1020行が残り、uniq -u 1110
これは正しい数です。問題は、>
最後にコマンドラインを使用して作成されたリストで視覚的に重複する項目を見つけることができず、通常(カスタムJohn the ripperの文脈で)パスワードクラッキングに問題があることです。
答え1
いいえ、同じではありません。まず、sort
リストがソートされます。第二に、uniq -u
各実行で「ユニークな」行、つまり前後に同じ入力行がない行のみが印刷されます。
$ printf "%s\n" 3 3 2 1 2 | sort -u
1
2
3
$ printf "%s\n" 3 3 2 1 2 | uniq -u
2
1
2
また見なさい:
- 「sort -u」と「sort | uniq」の違いは何ですか?
- uniqが十分にユニークではないのはなぜですか? uniq --uniqueはどうですか? (これは答えとより多くの例を持っています)