最初のカンマの前の一致に基づいて重複行を削除する

Question 1

awk以下はいくつかのデュアルチャンネルソリューションです。最初のパスでは、フィールド1の頻度を配列に保存しますx。xフィールド1の頻度が1として報告されると、2番目のパスは1行を印刷します。

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Answer

awk以下はいくつかのデュアルチャンネルソリューションです。最初のパスでは、フィールド1の頻度を配列に保存しますx。xフィールド1の頻度が1として報告されると、2番目のパスは1行を印刷します。

awk -F, 'first_pass{x[$1]++; next}; x[$1] == 1' first_pass=1 file first_pass=0 file

awk -F, 'BEGIN{while ((getline<ARGV[1]) > 0)x[$1]++}; x[$1] == 1' file

Question 2

短いGNUdatamash+sedコンビネーション：

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

上記のパイプラインの最初のプロセスは、最初のフィールド値に対して各グループの項目数をグループ化して計算し、-g1結果の数を最後のフィールドに追加します。

Answer

短いGNUdatamash+sedコンビネーション：

datamash -sft',' -g1 count 1 <file | sed -n 's/,1$//p'

上記のパイプラインの最初のプロセスは、最初のフィールド値に対して各グループの項目数をグループ化して計算し、-g1結果の数を最後のフィールドに追加します。

最初のカンマの前の一致に基づいて重複行を削除する

答え1

答え2

関連情報