AWKはCSVから2つ以上の空のフィールドを持つ行を削除しますか？ [閉鎖]

Question 1

提供されたサンプルファイルを使用し、目的の出力に基づいてフィールドが定義されていると仮定すると、|2番目と3番目のフィールドが空でないか空白の行を印刷しようとします。その場合は、次のことを行う必要があります。

$ awk -F "|" '$2~/[^[:space:]]/ && $3~/[^[:space:]]/' new2.csv
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000

ヘッダーもスキップするには、以下を使用してください。

awk -F "|" 'NR>1 && $2~/[^[:space:]]/ && $3~/[^[:space:]]/' new2.csv

本当にラインが欲しいなら誰でも第二または第三に、またはどちらもnullでない場合は、次のようにします。

awk -F "|" 'NR>1 && ($2~/[^[:space:]]/ || $3~/[^[:space:]]/)' new2.csv

Answer

提供されたサンプルファイルを使用し、目的の出力に基づいてフィールドが定義されていると仮定すると、|2番目と3番目のフィールドが空でないか空白の行を印刷しようとします。その場合は、次のことを行う必要があります。

$ awk -F "|" '$2~/[^[:space:]]/ && $3~/[^[:space:]]/' new2.csv
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000

ヘッダーもスキップするには、以下を使用してください。

awk -F "|" 'NR>1 && $2~/[^[:space:]]/ && $3~/[^[:space:]]/' new2.csv

本当にラインが欲しいなら誰でも第二または第三に、またはどちらもnullでない場合は、次のようにします。

awk -F "|" 'NR>1 && ($2~/[^[:space:]]/ || $3~/[^[:space:]]/)' new2.csv

Question 2

希望の出力を取得するには（retain rows that have values in the 2nd or 3rd column）：

$ awk -F'[[:space:]]*[|][[:space:]]*' '($2$3) != ""' file
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101583815||2005227222|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000
101583815|   |4905227222|420_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000
101583816||1805434338|420_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000

ただし、例に示されている出力を取得するには（2番目の値を持つ行を保持してください）そして3番目の列）：

$ awk -F'[[:space:]]*[|][[:space:]]*' '($2 != "") && ($3 != "")' file
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000

Answer

希望の出力を取得するには（retain rows that have values in the 2nd or 3rd column）：

$ awk -F'[[:space:]]*[|][[:space:]]*' '($2$3) != ""' file
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101583815||2005227222|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000
101583815|   |4905227222|420_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000
101583816||1805434338|420_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000

ただし、例に示されている出力を取得するには（2番目の値を持つ行を保持してください）そして3番目の列）：

$ awk -F'[[:space:]]*[|][[:space:]]*' '($2 != "") && ($3 != "")' file
101583815|1605227222|1605227234|412_99_0122818689|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|10000|0|0|10000|MARIA
101578445|HOLA|1605434338|412_99_0123259149|2020-09-24 00:00:00.000|2020-10-09 00:00:00.000|0|8000|0|0|8000

AWKはCSVから2つ以上の空のフィールドを持つ行を削除しますか？ [閉鎖]

答え1

答え2

関連情報