同じ行にない重複値の削除

Question 1

sort/を使用したくない場合は、次のようにuniqします。

$ awk '!seen[$2]++' file
RR0.out -1752.142111    
RR1.out -1752.141887    
RR3.out -1752.140319    
RR4.out -1752.140564    
RR5.out -1752.138532    
RR6.out -1752.138493

（末尾の空白だけが異なるRR5.out -1752.138532ため、期待される出力とは異なります。2番目のフィールドの一部ではなく、区切り文字の一部として扱います。）RR8.out -1752.138532awk

Answer

sort/を使用したくない場合は、次のようにuniqします。

$ awk '!seen[$2]++' file
RR0.out -1752.142111    
RR1.out -1752.141887    
RR3.out -1752.140319    
RR4.out -1752.140564    
RR5.out -1752.138532    
RR6.out -1752.138493

（末尾の空白だけが異なるRR5.out -1752.138532ため、期待される出力とは異なります。2番目のフィールドの一部ではなく、区切り文字の一部として扱います。）RR8.out -1752.138532awk

Question 2

$ sort -uk2 file
RR6.out -1752.138493
RR8.out -1752.138532
RR5.out -1752.138532
RR3.out -1752.140319
RR4.out -1752.140564
RR1.out -1752.141887
RR0.out -1752.142111

sort -u出力をソートし、-k22番目の列に基づいてソート/固有の一意の値のみを生成します。

最初の列のファイル名に基づいて出力を並べ替えるには、次のように並べ替えます。

$ sort -uk2 file | sort -k1
RR0.out -1752.142111
RR1.out -1752.141887
RR3.out -1752.140319
RR4.out -1752.140564
RR5.out -1752.138532
RR6.out -1752.138493
RR8.out -1752.138532

Answer

$ sort -uk2 file
RR6.out -1752.138493
RR8.out -1752.138532
RR5.out -1752.138532
RR3.out -1752.140319
RR4.out -1752.140564
RR1.out -1752.141887
RR0.out -1752.142111

sort -u出力をソートし、-k22番目の列に基づいてソート/固有の一意の値のみを生成します。

最初の列のファイル名に基づいて出力を並べ替えるには、次のように並べ替えます。

$ sort -uk2 file | sort -k1
RR0.out -1752.142111
RR1.out -1752.141887
RR3.out -1752.140319
RR4.out -1752.140564
RR5.out -1752.138532
RR6.out -1752.138493
RR8.out -1752.138532

同じ行にない重複値の削除

答え1

答え2

関連情報