シーケンスファイルのヘッダー解析

シーケンスファイルのヘッダー解析

複数のシーケンスファイルがあります。

>abc|d017961
sequence1......

>cdf|rhtdm9
sequence2......

>ijm|smthr12
sequence3......

>abc|d011wejr
sequence4......

>stg|eethwe77
sequence5......

ファイルを編集し、結果ファイルを次のように作成したいと思います。

>abc_ABC__d017961
sequence1......

>cdf_CDF__rhtdm9
sequence2......

>ijm_IJM__smthr12
sequence3......

>abc_ABC__d011wejr
sequence4......

>stg_STG__eethwe77
sequence5......

答え1

GNUの使用sed:

sed 's/>\([^|]*\)|/>\1_\U\1__/'

以下と同じperl

perl -pe's/>(.*?)\|/>$1_\U$1__/'

関連情報