重複行の削除

Question 1

あなたは試すことができます：

awk '{key = $4 < $7 ? $4 SUBSEP $7 : $7 SUBSEP $4} !seen[key]++' file

重複履歴を削除するために必要な最小限のコンテンツを保存します。

!seen[key]++「キー」が最初に表示されたときにのみレコードを印刷する「有名な」awkイディオムです。

Answer

あなたは試すことができます：

awk '{key = $4 < $7 ? $4 SUBSEP $7 : $7 SUBSEP $4} !seen[key]++' file

重複履歴を削除するために必要な最小限のコンテンツを保存します。

!seen[key]++「キー」が最初に表示されたときにのみレコードを印刷する「有名な」awkイディオムです。

Question 2

最初の列の値に基づいて、2-3-4列と5-6-7列のトリプルを並べ替えることができます。

perl -lane '@F[1,2,3,4,5,6] = @F[4,5,6,1,2,3] if $F[1] > $F[4]; print "@F"'

その後、実行してsort -u重複エントリを削除できます（ただし、列名を特別に処理する必要があります）。

Answer

最初の列の値に基づいて、2-3-4列と5-6-7列のトリプルを並べ替えることができます。

perl -lane '@F[1,2,3,4,5,6] = @F[4,5,6,1,2,3] if $F[1] > $F[4]; print "@F"'

その後、実行してsort -u重複エントリを削除できます（ただし、列名を特別に処理する必要があります）。

Question 3

各行を確認してください。

gnu sedを使用すると、データは「data」ファイルにあります。

sed -nE ':s G;/(\w+\s)(\w+\s)(\w+\s)(\S+\s)(\w+\s)(\w+\s)(\S+\s)(\w+)\n(.+\n)*\1\w+\s\6\7\w+\s\3\4\8/b; h;P' data

Answer

各行を確認してください。

gnu sedを使用すると、データは「data」ファイルにあります。

sed -nE ':s G;/(\w+\s)(\w+\s)(\w+\s)(\S+\s)(\w+\s)(\w+\s)(\S+\s)(\w+)\n(.+\n)*\1\w+\s\6\7\w+\s\3\4\8/b; h;P' data

関連情報