タブ区切りファイルの複数の単語を代替単語に置き換える

Question 1

これは実際には、「あるファイルからルックアップテーブルを作成して別のファイルを処理するために使用する」のバリエーションにすぎず、ルックアップキーを2番目のフィールドから切り離す必要があるという欠点があります。awkたとえば、次のようにできます。

awk '
  BEGIN{OFS=FS="\t"} 
  NR==FNR {
    a[$1]=$2; next
  } 
  {
    split($2,b,":"); 
    if (b[1] in a) $2 = a[b[1]]":"b[2]
  } 1' File_2 File_1

Answer

これは実際には、「あるファイルからルックアップテーブルを作成して別のファイルを処理するために使用する」のバリエーションにすぎず、ルックアップキーを2番目のフィールドから切り離す必要があるという欠点があります。awkたとえば、次のようにできます。

awk '
  BEGIN{OFS=FS="\t"} 
  NR==FNR {
    a[$1]=$2; next
  } 
  {
    split($2,b,":"); 
    if (b[1] in a) $2 = a[b[1]]":"b[2]
  } 1' File_2 File_1

Question 2

これを行う必要がありますsed。

sed '/^[a-z]*[[:cntrl:]].*/{s/[[:cntrl:]]/###/;H;d;}
 G
 s/\([a-z]*\)\(:.*\n\)\1###\([^[:cntrl:]]*\)/\3\2/
 P
 d' file_2 file_1

これは養子ですこの一般的なソリューション。どのように機能するかについては、こちらをご覧ください。

Answer

これを行う必要がありますsed。

sed '/^[a-z]*[[:cntrl:]].*/{s/[[:cntrl:]]/###/;H;d;}
 G
 s/\([a-z]*\)\(:.*\n\)\1###\([^[:cntrl:]]*\)/\3\2/
 P
 d' file_2 file_1

これは養子ですこの一般的なソリューション。どのように機能するかについては、こちらをご覧ください。

Question 3

アッ方法：

awk 'NR==FNR{a[$1]=$2;next}$2 in a{$2=a[$2]":"$3;$3=""}1' File_2 FS="[ |:]" File_1

出力：

522 Clostridium_tetani_E88:CTC00972     -   506 3.20E-138   
522 Natrialba_magadii:Nmag_3027    -   561 4.70E-73
522 nml:Namu_3564   -   566 1.80E-146

2つの入力ファイルnmlとコードが一致しません。nla

Answer

アッ方法：

awk 'NR==FNR{a[$1]=$2;next}$2 in a{$2=a[$2]":"$3;$3=""}1' File_2 FS="[ |:]" File_1

出力：

522 Clostridium_tetani_E88:CTC00972     -   506 3.20E-138   
522 Natrialba_magadii:Nmag_3027    -   561 4.70E-73
522 nml:Namu_3564   -   566 1.80E-146

2つの入力ファイルnmlとコードが一致しません。nla

タブ区切りファイルの複数の単語を代替単語に置き換える

答え1

答え2

答え3

関連情報