異なる列の各特定文字に対する「AおよびB」の頻度

Question

連想配列に基づいて awk ソリューションを適用する 1 つの方法は、$3各合計の内容を連結し、代替数値が返されるという事実を使用して、各合計の合計の発生回数を計算することです。$4$1ENDgsubABひも。たとえば、

awk '{
  a[$1]=a[$1]$3$4; 
  next;
} 
END{
  for (i in a) {
  n = length(a[i]) == 0 ? 1 : length(a[i]); # avoid div-by-zero
  printf "%s A %.1f\n", i, gsub(/A/,"",a[i])/n; 
  printf "%s B %.1f\n", i, gsub(/B/,"",a[i])/n;}
}' input
EA04 A 0.0
EA04 B 0.0
OA03 A 1.0
OA03 B 0.0
ID01 A 0.5
ID01 B 0.5
ID02 A 0.0
ID02 B 1.0

Answer 1

連想配列に基づいて awk ソリューションを適用する 1 つの方法は、$3各合計の内容を連結し、代替数値が返されるという事実を使用して、各合計の合計の発生回数を計算することです。$4$1ENDgsubABひも。たとえば、

awk '{
  a[$1]=a[$1]$3$4; 
  next;
} 
END{
  for (i in a) {
  n = length(a[i]) == 0 ? 1 : length(a[i]); # avoid div-by-zero
  printf "%s A %.1f\n", i, gsub(/A/,"",a[i])/n; 
  printf "%s B %.1f\n", i, gsub(/B/,"",a[i])/n;}
}' input
EA04 A 0.0
EA04 B 0.0
OA03 A 1.0
OA03 B 0.0
ID01 A 0.5
ID01 B 0.5
ID02 A 0.0
ID02 B 1.0

異なる列の各特定文字に対する「AおよびB」の頻度

答え1

関連情報