.txtファイルの束からすべての重複エントリを削除します。

Question

シンプル

sort -u Documents/*.txt > result.txt

それは行わなければなりません。sortメモリよりも大きなファイルを処理する方法が既にわかっているため、awkで表示されるメモリ不足エラーは発生しないでください。 awkにメモリが足りないという事実が少し驚いたことを認めなければなりません。 32ビットアプリケーションにコンパイルされましたか？

通常、sortこの方法を使用するよりも使用する方が遅くなる可能性がありますawk '!seen[$1]++'。ファイルをグループ化して速度を回復できます。

Answer 1

シンプル

sort -u Documents/*.txt > result.txt

それは行わなければなりません。sortメモリよりも大きなファイルを処理する方法が既にわかっているため、awkで表示されるメモリ不足エラーは発生しないでください。 awkにメモリが足りないという事実が少し驚いたことを認めなければなりません。 32ビットアプリケーションにコンパイルされましたか？

通常、sortこの方法を使用するよりも使用する方が遅くなる可能性がありますawk '!seen[$1]++'。ファイルをグループ化して速度を回復できます。

関連情報