欠落しているデータを確認したときに同じIDを持つすべての行の列の平均値

Question

WDフィールドが空でない場合にのみ数を追加できます。

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

車輪を再発明したくない場合は、次のものを使用できます。ミラー、stats1希望の方法で空のフィールドを処理するようです。

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

MillerバージョンのUbuntuはuniverseリポジトリで利用可能です。

Answer 1

WDフィールドが空でない場合にのみ数を追加できます。

$ awk '
    NR>1 {sum[$1] += $5; count[$1] += $5=="" ? 0 : 1} 
    END {for (i in sum) print i, (count[i] > 0 ? sum[i]/count[i] : "-")}
  ' WD.txt
1001 36.1111
1002 -
1003 79.0789

車輪を再発明したくない場合は、次のものを使用できます。ミラー、stats1希望の方法で空のフィールドを処理するようです。

$ mlr --pprint stats1 -g PLOT -a mean -f WD WD.txt 
PLOT WD_mean
1001 36.111100
1002 -
1003 79.078950

MillerバージョンのUbuntuはuniverseリポジトリで利用可能です。

欠落しているデータを確認したときに同じIDを持つすべての行の列の平均値

答え1

関連情報