私はこのヘッダーを持っています:
>tr|G3Q381|G3Q381_GASAC Uncharacterized protein OS=Gasterosteus aculeatus PE=4 SV=1
幸いなことに、私はこれを実現するのに役立ちました。
>G3Q381_GASAC
ただし、次のように前の形式から最後の2文字を削除する必要があります。
>G3Q381_GAS
元の長いヘッダー(中央のヘッダーではない)からインポートできますか?
答え1
許可されるかどうかはわかりませんが、2番目のパイプの前のすべての項目を削除し、最初のスペースの後ろのすべての|
項目から2文字を引いたすべての項目を削除できます。
sed -e 's/^[^|]*|/>/' -e 's/^[^|]*|/>/' -e 's/.. .*$//'