複数のシーケンスファイルがあります。
>abc|d017961
sequence1......
>cdf|rhtdm9
sequence2......
>ijm|smthr12
sequence3......
>abc|d011wejr
sequence4......
>stg|eethwe77
sequence5......
ファイルを編集し、結果ファイルを次のように作成したいと思います。
>abc_ABC__d017961
sequence1......
>cdf_CDF__rhtdm9
sequence2......
>ijm_IJM__smthr12
sequence3......
>abc_ABC__d011wejr
sequence4......
>stg_STG__eethwe77
sequence5......
答え1
GNUの使用sed
:
sed 's/>\([^|]*\)|/>\1_\U\1__/'
以下と同じperl
:
perl -pe's/>(.*?)\|/>$1_\U$1__/'