CSVファイルの特定のフィールドを解析し、一致するパターンに基づいてフィールドを一緒に追加する必要があります。変数を正常に設定したが1〜20個の変数がある場合は、変数を追加する方法を理解するのに役立ちます。 (または、この問題を解決する別のより簡単な方法があるかもしれません。)
ソースファイルコンテンツの例:
Server-Name,Volume-Name,Vol-Size,Logical-Space-In-Use
FTWTRAQNETSQL01,FTWTRAQNETSQL01_e,2008,1989
FTWTRAQNETSQL01,FTWTRAQNETSQL01_f,106,63.698
FTWTRAQNETSQL02,FTWTRAQNETSQL02_e,2008,1989
FTWTRAQNETSQL02,FTWTRAQNETSQL02_f,106,4.155
ftwvocmpsqln01,ftwvocmpsqln01_1,1002,21.047
ftwvocmpsqln01,ftwvocmpsqln01_2,104,55.379
ftwspsqln02,ftwspsqln02_H,501,0
ftwvocmpsqln02,ftwvocmpsqln02_1,1002,20.732
ftwvocmpsqln02,ftwvocmpsqln02_2,104,55.380
出力は、各固有サーバー名に対して、すべてのフィールド3値とすべてのフィールド4値が追加された1行でなければなりません。サーバーには複数のボリュームがあり、最大20個まで可能です。必須ファイルの出力は次のとおりです。
Server-Name,Vol-Size,Logical-Space-In-Use
FTWTRAQNETSQL01,2114,2052.698
FTWTRAQNETSQL02,2114,1993.155
ftwvocmpsqln01,1106,76.426
ftwspsqln02,501,0
ftwvocmpsqln02,1106,76.112
Excelではこれを約7秒で実行できますが、これまでbash(または他のシェル)を使用して自動化するソリューションを見つけることができませんでした。
これはこれまでのフィールド3だけを見たコードです。一意のサーバーの各反復に対して変数を正しく設定しますが、可変数の変数を追加する方法がわかりません。
for i in $( awk -F , '{print $1}' $REPORT | grep -v Server-Name | uniq )
do
c=0
for num in $( grep $i $REPORT | awk -F , '{print $3}' )
do
eval "var$c=$num";
c=$((c+1));
done
done
答え1
GNUデータマッシュを使用する:
$ datamash -t, --header-in groupby 1 sum 3,4 < file.csv
FTWTRAQNETSQL01,2114,2052.698
FTWTRAQNETSQL02,2114,1993.155
ftwvocmpsqln01,1106,76.426
ftwspsqln02,501,0
ftwvocmpsqln02,1106,76.112
答え2
シェルではなく「Unix方式」です。
awk -F',' 'NR==1; NR>1{s3[$1]+=$3; s4[$1]+=$4} END { for(i in s3){printf("%s,%s,%s\n",i,s3[i],s4[i])} }' file
出力順序が入力順序と一致しない場合があります。
説明する:
awk # use awk.
-F',' # set the field separator as comma (,)
' # start an awk script.
NR==1; # print first line (header)
NR>1{ # for lines other than first
s3[$1]+=$3; # add values on third field
s4[$1]+=$4 # add values on fourth field
} # close the previous {
END { # after all lines have been read
for(i in s3){ # for each index of the array
# (all unique values of field $1)
printf("%s,%s,%s\n",i,s3[i],s4[i]) # print values.
} # close the for loop.
} # close the END loop.
' file # end script code and name the file.
答え3
Miller()を使用して、フィールドごとにグループ化された2つの列のmlr
合計を計算します。Vol-Size
Logical-Space-In-Use
Server-Name
$ mlr --csv stats1 -a sum -f Vol-Size,Logical-Space-In-Use -g Server-Name file
Server-Name,Vol-Size_sum,Logical-Space-In-Use_sum
FTWTRAQNETSQL01,2114,2052.698000
FTWTRAQNETSQL02,2114,1993.155000
ftwvocmpsqln01,1106,76.426000
ftwspsqln02,501,0
ftwvocmpsqln02,1106,76.112000