複数ファイルの平均と標準偏差

Question 1

複雑なソリューションの使い方生地コマンドとデータ混合ツール：

さらなる処理のために、すべてのファイルを1つのファイルに結合します。
```
paste [0-9]*.out | datamash transpose > data
```
-- datamash transpose- 行を列に置き換えます。
合計フィールド数を取得します。
```
nf=`awk '{print NF; exit}' data`
```

平均と標準偏差を計算します。

for ((i=1; i<$nf; i++)); do datamash mean $i pstdev $i < data; done

出力は次のとおりです（最初の列 - 平均、2番目の列 - 標準偏差値）。

0.596477    0.11180339887499
0.589331    0.11180339887499
0.594394    0.11180339887499
0.575003    0.11180339887499
0.578981    0.11180339887499
0.569547    0.11180339887499
0.582834    0.11180339887499
.......

Answer

複雑なソリューションの使い方生地コマンドとデータ混合ツール：

さらなる処理のために、すべてのファイルを1つのファイルに結合します。
```
paste [0-9]*.out | datamash transpose > data
```
-- datamash transpose- 行を列に置き換えます。
合計フィールド数を取得します。
```
nf=`awk '{print NF; exit}' data`
```

平均と標準偏差を計算します。

for ((i=1; i<$nf; i++)); do datamash mean $i pstdev $i < data; done

出力は次のとおりです（最初の列 - 平均、2番目の列 - 標準偏差値）。

0.596477    0.11180339887499
0.589331    0.11180339887499
0.594394    0.11180339887499
0.575003    0.11180339887499
0.578981    0.11180339887499
0.569547    0.11180339887499
0.582834    0.11180339887499
.......

Question 2

標準偏差を一度に計算できます。スクリプトをあまり変更する必要はありません。

awk '{a[FNR]+=$1; b[FNR]++; c[FNR]+=$1*$1 } 
     END{
        for(i=1;i<=FNR;i++)
          print a[i]/b[i], sqrt((c[i]-a[i]*a[i]/b[i])/(b[i]-1)) ;
     }
' *.out

これは子供のような実装、別の実装、同じWikiページの「オンライン方法」：

awk '{
  x=$1
  n[FNR] += 1
  delta = x - mean[FNR]
  mean[FNR] += delta/n[FNR]
  delta2 = x - mean[FNR]
  M2[FNR] += delta * delta2
}
END{
for(i=1;i<=FNR;i++)
        if(n[i]<2)
                print mean[i], 0
        else
                print mean[i], sqrt(M2[i]/(n[i]-1))
}' *.out

Answer

標準偏差を一度に計算できます。スクリプトをあまり変更する必要はありません。

awk '{a[FNR]+=$1; b[FNR]++; c[FNR]+=$1*$1 } 
     END{
        for(i=1;i<=FNR;i++)
          print a[i]/b[i], sqrt((c[i]-a[i]*a[i]/b[i])/(b[i]-1)) ;
     }
' *.out

これは子供のような実装、別の実装、同じWikiページの「オンライン方法」：

awk '{
  x=$1
  n[FNR] += 1
  delta = x - mean[FNR]
  mean[FNR] += delta/n[FNR]
  delta2 = x - mean[FNR]
  M2[FNR] += delta * delta2
}
END{
for(i=1;i<=FNR;i++)
        if(n[i]<2)
                print mean[i], 0
        else
                print mean[i], sqrt(M2[i]/(n[i]-1))
}' *.out

複数ファイルの平均と標準偏差

答え1

答え2

関連情報