kshの2つのフィールドに基づいてソート

kshの2つのフィールドに基づいてソート
file-
xyz.161209:/userlogs/logs/reports 355G 195G 150G 57% /home
xyz.161209:/userlogs/logs/reports 355G 197G 148G 58% /home
xyz.161209:/userlogs/logs/reports 355G 201G 145G 59% /home
xyz.161210:/userlogs/logs/reports 355G 218G 129G 63% /home
xyz.161210:/userlogs/logs/reports 355G 223G 124G 65% /home
xyz.161210:/userlogs/logs/reports 355G 226G 121G 66% /home
xyz.161211:/userlogs/logs/reports 355G 210G 136G 61% /home
xyz.161211:/userlogs/logs/reports 355G 220G 127G 64% /home
xyz.161211:/userlogs/logs/reports 355G 173G 171G 51% /home

Result
xyz.161209:/userlogs/logs/reports 355G 201G 145G 59% /home
xyz.161210:/userlogs/logs/reports 355G 226G 121G 66% /home
xyz.161211:/userlogs/logs/reports 355G 220G 127G 64% /home

ソートされた日付を含む最初の列ごとに、最初の列に基づいてグループ化し、最も高い割合を持つ5番目の列を含む行のみを表示します。

以下は私が試したことですが、目的の結果を得ることはできません。誰でも私を助けることができますか?

awk -F, '{if ((a[substr($1,5,6)] == substr($1,5,6)) && (b[substr($5,1,2)] < substr($5,1,2)))b[substr($5,1,2)]=substr($5,1,2);}END{for(i in a){print i,a[i];}}' test.txt

答え1

これが私が思いついたものです。これが最も効率的な方法だと思い、より効率的なものを見たいです。ただし、操作は完了です。

sort test.txt | awk -F':' '{print $1}' | uniq > unique.txt

while read p; do
  grep $p test.txt | sort -r -k5 | head -1
done < unique.txt
rm unique.txt

説明する:

sort test.txt | awk -F':' '{print $1}' | uniq > unique.txt リストからすべての一意のファイル名を抽出します。

grep $p test.txt | sort -r -k5 | head -15番目のフィールド(%値を含む)に基づいて降順に並べ替え、最初の行のみを印刷します。

答え2

これは私にとって効果的ですksh

sort -nrk5 -t ' ' test.txt | sort -t '.' -unk2

このテストファイルが与えられたら:

  • otherfile_.161209:/userlogs/logs/reports 000G 000G 000G 55% /home
    somefile_.161209:/userlogs/logs/reports 000G 000G 000G 45% /home
    file71.161209:/userlogs/logs/reports 000G 000G 000G 71% /home
    file_longer_12.161209:/userlog/log/report000G 000G 000G78%/家
    qwerty_.161210:/userlogs/logs/reports 000G 000G 000G 31% /home
    xyz.161210:/userlogs/logs/reports 000G 000G 000G 34% /home
    abcdef.161210:/userlogs/logs/reports 000G 000G 000G85%/家
    hellojoe_.161210:/userlogs/logs/reports 000G 000G 000G 45% /home
    kitchen_.161211:/userlogs/logs/reports 000G 000G 000G 39% /home
    room.161211:/userlogs/logs/reports 000G 000G 000G95%/家
    Rooftop_77.161211:/userlogs/logs/reports 000G 000G 000G 12% /home
    f.161211:/userlogs/logs/reports 000G 000G 000G 30% /home

結果は次のとおりです。

  • file_longer_12.161209:/userlog/log/report000G 000G 000G78%/家
    abcdef.161210:/userlogs/logs/reports 000G 000G 000G85%/家
    room.161211:/userlogs/logs/reports 000G 000G 000G95%/家

したがって、次のファイル名を受け入れます。

  • 長さが異なります
  • 番号が含まれています。

分解:

  • sort -nrk5 -t ' ':最初は5列にパーセントでソートされています。
  • sort -t '.' -unk2:最初のフィールドでのみ日付文字列を計算して一意の結果を印刷します(.区切り文字を使用)。

答え3

これはどうですか?

awk -F"[.: ]" '{if($(NF-1)+0>Arr[$2]+0){Arr[$2]=$(NF-1)+0;Res[$2]=$0}}END{for (i in Res){print Res[i]}}' file
xyz.161210:/userlogs/logs/reports 355G 226G 121G 66% /home
xyz.161211:/userlogs/logs/reports 355G 220G 127G 64% /home
xyz.161209:/userlogs/logs/reports 355G 201G 145G 59% /home


awk -F"[.: ]" '{
if($(NF-1)+0>Arr[$2]+0)
{
   Arr[$2]=$(NF-1)+0;
    Res[$2]=$0
}
}
END{
for (i in Res)
{
print Res[i]
}
}' file

関連情報