ヘッダーの特定の列に基づいて複数のcsvファイルに分割したい大きなcsvファイルがあります。目標は、国の列に関連するすべてのファイルを生成することです。
たとえば、
-->input file: file.csv
,,fr,fr,fr,ca,ca,ca,be,be,be
id,dateContact,name,date1,date2,name,date1,date2,name,date1,date2
100,2019-03-19,AA,2019-03-20,2019-03-22,AAA,2019-02-19,2019-02-22,AAAA,2019-02-19,2019-02-22
101,2019-08-15,BB,2019-08-16,2019-08-17,BBB,2019-07-16,2019-07-17,BBBB,2019-07-16,2019-07-17
102,2020-01-19,CC,2020-01-21,2020-01-21,CCC,2020-01-21,2020-01-21,CCCC,2020-01-21,2020-01-21
-必須出力ファイル:
-->output_fr.csv:
id,dateContact,name,date1,date2
100,2019-03-19 ,AA ,2019-03-20,2019-03-22
101,2019-08-15 ,BB ,2019-08-16,2019-08-17
102,2020-01-19 ,CC ,2020-01-21,2020-01-21
-->output_ca.csv:
id,dateContact,name,date1,date2
100,2019-03-19 ,AAA ,2019-02-19,2019-02-22
101,2019-08-15 ,BBB ,2019-07-16,2019-07-17
102,2020-01-19 ,CCC ,2020-01-21,2020-01-21
-->output_be.csv:
id,dateContact,name,date1,date2
100,2019-03-19,AAAA,2019-02-19,2019-02-22
101,2019-08-15,BBBB,2019-07-16,2019-07-17
102,2020-01-19,CCCC,2020-01-21,2020-01-21
次のawkスクリプト記述を使用して ここ:
awk 'BEGIN { FS="," ; OFS=","}
{ for (i=3; i<=NF;i++){
if (NR==1) { file[i]=$i }
if (NR!=1) { f="output_" file[i] ".csv";
g="output_" file[i+1] ".csv";
printf("%s%s",$i,f==g?OFS:ORS)>>f;
close(f);
}
}
}' file.csv
国の列は検索できますが、空の列(idおよびdateContact)は検索できません。出力ファイルは次のとおりです。
-->output_fr.csv:
name,date1,date2
AA,2019-03-20,2019-03-22
BB,2019-08-16,2019-08-17
CC,2020-01-21,2020-01-21
-->output_ca.csv:
name,date1,date2
AAA,2019-02-19,2019-02-22
BBB,2019-07-16,2019-07-17
CCC,2020-01-21,2020-01-21
-->output_be.csv:
name,date1,date2
AAAA,2019-02-19,2019-02-22
BBBB,2019-07-16,2019-07-17
CCCC,2020-01-21,2020-01-21
awkを使ってこれを行うにはどうすればよいですか?ありがとうございます。