特定のデータで各地域を一意に並べ替え、親ヒット数だけを印刷できますか?
与えられたデータ
aza1 18
bcn1 16
sat2 12
lcy2 12
fra1 12
aza1 12
bcn1 10
sat2 8
lcy2 9
fra1 13
aza1 21
bcn1 2
sat2 10
lcy2 0
fra1 1
希望の出力
aza1 21
bcn1 16
sat2 12
lcy2 12
fra1 13
答え1
順序が重要な場合、解決策は次のものを使用することです。タイプそしてユニーク
<INPUT_FILE sort -k 1,1 -k 2nr,2 | uniq -w4
出力:
aza1 21
bcn1 16
fra1 13
lcy2 12
sat2 12
パラメータのソート:
-k:キーベースの並べ替え(この場合は列、-tとペアになります)
-n:数値順に並べ替え
-r:逆順
(オプション)-t:キー区切り記号を変更したい場合(デフォルト:空白)
唯一のパラメータ:
-w:最初のN文字を選択
説明する:
あなたの質問では、最初の列を最初に並べ替えてから2番目の列を並べ替える必要があります。だからそこに-k 1,1続いて-k 2,2。しかし、2番目の鍵(のみ)数字を逆順に並べる必要があります。だから-k 2nr,2。
-nまたは-rソートパラメーターが-kパラメーターの外側にある場合、特定のキーではなく入力全体に適用されます。
最後に、唯一の行を見つける必要がありますが、最初の4文字だけが一致します。したがって、ユニクロ-w 4
答え2
順序が重要でない場合:
<infile sort -rnk2,2 |sort -uk1,1
-r
ey列番号()に数字を使用し、-n
最初のey列()の行を保持してラベルを付けます。sort
-k
2
sort -rnk2,2
-u
-k
sort -uk1,1
または次のようになりますawk
。
<infile awk '
{ arr[$1]= (arr[$1]<$2)? $2 : arr[$1] }
END{ for (x in arr) print x, arr[x] }'