両方のファイルの複数の列を一致させて印刷します。

両方のファイルの複数の列を一致させて印刷します。

2つのファイルがありますが、私がしなければならないことは、2つのファイルのcolumn1に基づいて共通の行を見つけ、一致する場合は新しいファイルcol1(2つのファイル間の共通)file1col2とfile2col2に書き込むことです。

ファイル1:

col1                         file1col2
10:100000525-100001560(+)    0.971465226620556
10:100001724-100002618(+)    0.940918504451204
10:100002725-100002970(+)    0.946592696189412
10:100003104-100004184(+)    0.736305487299153
10:100004450-100005051(+)    0.70823022283736
10:100005158-100005876(+)    0.969728923411704
10:100006075-100007551(+)    0.855411430976336
10:100007764-100009009(+)    0.274219271261146
10:100009146-100011362(+)    0.927057564779308
10:100011583-100011887(+)    0.883431738847249

ファイル2

col1                         file2col2
10:100000525-100001560(+)    0.943385996874889
10:100001724-100002618(+)    0.981929023174133
10:100002725-100002970(+)    0.955549170283206
10:100003104-100004184(+)    0.736440826679551
10:100004450-100005051(+)    0.689045711238636
10:100005158-100005876(+)    0.964995337925152
10:100006075-100007551(+)    0.873411848029685
10:100007764-100009009(+)    0.37719743446494
10:100009146-100011362(+)    0.943862343124518
10:100011583-100011887(+)    0.902915705720447

希望の出力

col1(common between two files)  file1col2   file2col2
10:100000525-100001560(+)   0.971465227 0.943385997
10:100001724-100002618(+)   0.940918504 0.981929023
10:100002725-100002970(+)   0.946592696 0.95554917
10:100003104-100004184(+)   0.736305487 0.736440827
10:100004450-100005051(+)   0.708230223 0.689045711
10:100005158-100005876(+)   0.969728923 0.964995338
10:100006075-100007551(+)   0.855411431 0.873411848
10:100007764-100009009(+)   0.274219271 0.377197434
10:100009146-100011362(+)   0.927057565 0.943862343
10:100011583-100011887(+)   0.883431739 0.902915706

答え1

参加する+アッ解決策:

join --header file1 file2 | awk 'NR>1{ $2=sprintf("%1.9f",$2); $3=sprintf("%.9f",$3) }1' > result.txt

cat result.txt
col1 file1col2 file2col2
10:100000525-100001560(+) 0.971465227 0.943385997
10:100001724-100002618(+) 0.940918504 0.981929023
10:100002725-100002970(+) 0.946592696 0.955549170
10:100003104-100004184(+) 0.736305487 0.736440827
10:100004450-100005051(+) 0.708230223 0.689045711
10:100005158-100005876(+) 0.969728923 0.964995338
10:100006075-100007551(+) 0.855411431 0.873411848
10:100007764-100009009(+) 0.274219271 0.377197434
10:100009146-100011362(+) 0.927057565 0.943862343
10:100011583-100011887(+) 0.883431739 0.902915706

詳細:

  • 参加する --headerオプション - 各ファイルの最初の行をフィールドヘッダーとして処理し、ペアなしで印刷します。

  • NR>1- 2番目のレコードから処理を開始する(NR- 現在のレコードの番号)、つまり - スキップヘッダーワイヤー

  • sprintf("%1.9f",$2)-$2引数(2番目の列)を9桁の小数点の浮動小数点数としてフォーマットします。

関連情報