テキストファイルから重複項目を削除する

Question 1

Uniqは行の残りの部分をソートしたり削除したりしません。uniq -d重複した行のみが表示されます。これは、各行を1回表示することとは異なります（つまり、-d2回連続して表示する必要があります）。

まず、興味深い列を切り取り、並べ替えて一意の要素を見つけます。

cut -d ' ' -f 1 your_file | sort | uniq

Answer

Uniqは行の残りの部分をソートしたり削除したりしません。uniq -d重複した行のみが表示されます。これは、各行を1回表示することとは異なります（つまり、-d2回連続して表示する必要があります）。

まず、興味深い列を切り取り、並べ替えて一意の要素を見つけます。

cut -d ' ' -f 1 your_file | sort | uniq

Question 2

awkを使用できます。

awk '!x[$1]++ { print $1 }' file

Answer

awkを使用できます。

awk '!x[$1]++ { print $1 }' file

Question 3

uniq -d入力に重複行のみをリストします。ファイルに重複行（完全とみなされる）が含まれていないため、何も出力されません。

目的の結果を得るには、最初の列を抽出してフィルタリングする必要があります。

cut -d\  -f1 file | uniq

ファイルがソートされているとします（uniq隣接する行のみをフィルタリングします）。

cut -d\  -f1 file | sort -u

awkまたは指摘したようにすることができますタレジン、最初の列だけを出力するいくつかのバリエーションがあります。

awk '!x[$1]++ { print $1 }' file

Answer

uniq -d入力に重複行のみをリストします。ファイルに重複行（完全とみなされる）が含まれていないため、何も出力されません。

目的の結果を得るには、最初の列を抽出してフィルタリングする必要があります。

cut -d\  -f1 file | uniq

ファイルがソートされているとします（uniq隣接する行のみをフィルタリングします）。

cut -d\  -f1 file | sort -u

awkまたは指摘したようにすることができますタレジン、最初の列だけを出力するいくつかのバリエーションがあります。

awk '!x[$1]++ { print $1 }' file

関連情報