科学的表記法の数字を含むが記号を持たないファイルを操作しようとしていますe
。つまり1.2e+3
、1.2+3
。
私が考えることができる最も簡単な方法は、に置き換えawk
、関数を使用し、新しいファイルで計算を実行することです。負の値の場合も同様です。したがって、次のコマンドを使用して簡単な修正を実行できます。+
e+
gsub
awk '{gsub("+", "e+", $1); print $1, $2, $3, $4, $5}' file_in
すべての列で同じことを行います。
ただし、ファイルには負の数も含まれているため、状況がより複雑になります。サンプルファイルは次のとおりです。
1.056000+0 5.000000-1 2.454400-3 2.914800-2 8.141500-6
2.043430+1 5.000000-1 2.750500-3 2.698100-2-2.034300-4
3.829842+1 5.000000-1 1.969923-2 2.211364-2 9.499900-6
4.168521+1 5.000000-1 1.601262-2 3.030919-2-3.372000-6
6.661784+1 5.000000-1 5.250575-2 3.443669-2 2.585500-5
7.278104+1 5.000000-1 2.137055-2 2.601701-2 8.999800-5
9.077287+1 5.000000-1 1.320498-2 2.961020-2-1.011600-5
9.248130+1 5.000000-1 3.069610-3 2.786329-2-6.317000-5
1.049935+2 5.000000-1 4.218794-2 3.321955-2-5.097000-6
1.216283+2 5.000000-1 1.432105-2 3.077165-2 4.300300-5
操作や計算にこれらのファイルを使用する方法についてのアイデアはありますか?
答え1
この出力は正しいですか?
1.056000e+0 5.000000e-1 2.454400e-3 2.914800e-2 8.141500e-6
2.043430e+1 5.000000e-1 2.750500e-3 2.698100e-2-2.034300e-4
3.829842e+1 5.000000e-1 1.969923e-2 2.211364e-2 9.499900e-6
4.168521e+1 5.000000e-1 1.601262e-2 3.030919e-2-3.372000e-6
6.661784e+1 5.000000e-1 5.250575e-2 3.443669e-2 2.585500e-5
7.278104e+1 5.000000e-1 2.137055e-2 2.601701e-2 8.999800e-5
9.077287e+1 5.000000e-1 1.320498e-2 2.961020e-2-1.011600e-5
9.248130e+1 5.000000e-1 3.069610e-3 2.786329e-2-6.317000e-5
1.049935e+2 5.000000e-1 4.218794e-2 3.321955e-2-5.097000e-6
1.216283e+2 5.000000e-1 1.432105e-2 3.077165e-2 4.300300e-5
パスワード:
perl -lne 's/(\.\d+)(\+|\-)/\1e\2/g; print' sample
説明する:
-lne
行末処理、各入力行処理、次のコードの実行s/(\.\d+)(\+|\-)/\1e\2/g
:- 変える(
s
) (.\d+)(\+|\-)
2つのグループ(ドットと数字)と(プラス記号またはマイナス記号)を見つける\1e\2
最初のセットと交換してからe
2番目のセットと交換してください。g
グローバル - 各行の最初の置換で停止することなく、すべての可能なヒットを処理します。
- 変える(
print
この行を印刷してくださいsample
入力ファイル
見つからない場合はスペースが追加されます。実際にはとにかく数字の間にスペースが残ります。つまり。特定の状況で2つのスペースがある場合、出力には1つのスペースしか表示されません。
perl -lne 's/(\.\d+)(\+|\-)(\d+)(\s*)/\1e\2\3 /g; print' sample
ほとんどのコンテンツは前の記事と似ています。新しいのは(\d+)
グループNR 3と(\s*)
グループNR 4です。*
ここで意味するのはオプションです。代わりに\4
noを使用してください。しかし、スペースがあります。
出力は次のとおりです。
1.056000e+0 5.000000e-1 2.454400e-3 2.914800e-2 8.141500e-6
2.043430e+1 5.000000e-1 2.750500e-3 2.698100e-2 -2.034300e-4
3.829842e+1 5.000000e-1 1.969923e-2 2.211364e-2 9.499900e-6
4.168521e+1 5.000000e-1 1.601262e-2 3.030919e-2 -3.372000e-6
6.661784e+1 5.000000e-1 5.250575e-2 3.443669e-2 2.585500e-5
7.278104e+1 5.000000e-1 2.137055e-2 2.601701e-2 8.999800e-5
9.077287e+1 5.000000e-1 1.320498e-2 2.961020e-2 -1.011600e-5
9.248130e+1 5.000000e-1 3.069610e-3 2.786329e-2 -6.317000e-5
1.049935e+2 5.000000e-1 4.218794e-2 3.321955e-2 -5.097000e-6
1.216283e+2 5.000000e-1 1.432105e-2 3.077165e-2 4.300300e-5
答え2
たとえば、次のように使用することもできますsed
。
<infile sed -E 's/([0-9])([+-])([0-9])/\1e\2\3/g' | awk '{ print $1 + 0 }'
しかし、これは、OPリストの列が時々区別されないことを考慮しない。適切な精度を持つ解決策は次のとおりです。
<infile sed -E 's/.{11}/& /g' |
sed -E 's/([0-9])([+-])/\1e\2/g' |
gawk '{ print $1 + 0 }' OFMT='%.7g'
出力:
1.056
20.4343
38.29842
41.68521
66.61784
72.78104
90.77287
92.4813
104.9935
121.6283