csvファイルで指定された列の最大数を見つける

csvファイルで指定された列の最大数を見つける

4つの列を含むスペースで区切られたファイルがあります。 awkを使用して各列の最大値を見つけたいと思います。私のawkスクリプトはファイルの最後にこの情報を出力する必要があります。

たとえば、私のファイルが次のような場合:

              Banana  Oranges  Lemons 
Case_1        50      243      143
Case_2        45      443      103
Case_3        56      234      128
Case_4        64      164      183
Case_5        54      342      176

awkスクリプトを実行したら、次のように出力する必要があります。

              Banana  Oranges  Lemons 
Case_1        50      243      143
Case_2        45      443      103
Case_3        56      234      128
Case_4        64      164      183
Case_5        54      342      176

Banana maximum happens at case 4: The complete line is
Case_4        64      164      183

Orange maximum happens at case 2: The complete line is
Case_2        45      443      103

awkコードを書くのに役立つ人はいますか?

答え1

BEGIN {
 col[0]=""
 max[0]=""
 casenum=0
 text[0]=""
}

{ print $0 }

NR == 1 { split($0,col,FS); }

/Case_/ && NR > 1 { 
  casenum++
  split($0,vals,FS)
  text[casenum]=$0
  for(i=1;i<=length(col);i++)
  { 
    if(vals[i+1] > max[i])
    {
      max[i]=vals[i+1]
      item[i]=casenum
    }
  }
}

END {
  for(i=1;i<=length(col);i++)
  {
    printf "\n%s maximum happens at case %d: The complete line is\n",col[i],item[i]
    print text[item[i]]
  }
}

これにより、次のような出力が生成されます。

              Banana  Oranges  Lemons 
Case_1        50      243      143
Case_2        45      443      103
Case_3        56      234      128
Case_4        64      164      183
Case_5        54      342      176

Banana maximum happens at case 4: The complete line is
Case_4        64      164      183 

Oranges maximum happens at case 2: The complete line is
Case_2        45      443      103 

Lemons maximum happens at case 4: The complete line is
Case_4        64      164      183 

関連情報