ファイルBの一致する列値を使用して、ファイルAの列に欠落している値を入力します。

ファイルBの一致する列値を使用して、ファイルAの列に欠落している値を入力します。

2つのファイルがあります。ファイルAのNAをファイルBの列に置き換えたいです。

File A

ENSG00000134539 131.178876666595 8.17899671725794 0.855069805781827    9.56529708095531 1.12E-21 1.74E-20 KLRD1
ENSG00000135250 1133.42737699143 -1.12767591222818 0.117927787197502 -9.56242747385385 1.15E-21 1.78E-20 SRPK2
ENSG00000214870 103.556102419252 -2.15426846253205 0.225384371016956 -9.55819808095733 1.20E-21 1.86E-20 NA
ENSG00000136153 249.119544948009 -1.32395826295328 0.138571556732024 -9.55432914356018 1.24E-21 1.93E-20 LMO7

File B

ENSG00000214870 AC004540.5 103.556102419252
ENSG00000267121 CTD-2020K17.1 231.295616750853
ENSG00000254733 RP11-317J19.1 53.0097117074116

最初の列でファイルAとファイルBを一致させ、ファイルAの最後の列のNAをファイルBの2番目の列に置き換えたいと思います。

いくつかの方法を試しましたが、Linuxに初めてアクセスしたため、完了できませんでした。

awk 'NR==FNR{A[$1]++;next} B[$7]==A[$2]' file1 file2

awk 'NR==FNR{ if (A[$1] in B[$1]) B[$7]==A[$2]}' file1 file2

私のコマンドに問題がありますか?

答え1

この試み:

awk 'NR==FNR{a[$1]=$2; next} ($1 in a) && $NF=="NA"{$NF=a[$1]} 1' f2 f1
  • a[$1]=$2最初の列をキーとして使用し、2番目の列データを値として保存
  • ($1 in a) && $NF=="NA"最初の列が配列のキーでありa、最後の列がキーであることを確認してください。NA
    • $NF=a[$1]最後の列をa配列に格納されている値に変更します。
  • 1入力記録内容の印刷
  • f2 f1入力ファイルの順序に注意してください。 2番目のファイルの後に最初のファイルが続きます。

関連情報