タイトルの下のシーケンスのリンク

タイトルの下のシーケンスのリンク

File1のようなファイルがあります。たとえば、タイトルが「Contig1」で、そのタイトルの下のすべてのシーケンスをリンクしたいとします。

ファイル1:

>Contig1
ACCCCATACATCCAAA
NNNNNNNNNNCATACA
AAAAAAAACTANNNNN
ACATACAAAAA
>Contig12
CCCCACAATTTTTAAA
GGGGGNNNNNCATACA
AGGAATTAACTANNAC
GGATATA

予想出力:

>Contig1
ACCCCATACATCCAAANNNNNNNNNNCATACAAAAAAAAACTANNNNNACATACAAAAA
>Contig12
CCCCACAATTTTTAAAGGGGGNNNNNCATACAAGGAATTAACTANNACGGATATA

助けてください?乾杯!

答え1

もう一つの奇妙な:

awk '{$1=RS $1 ORS}NR>1' FS='\n' RS=\> OFS= file

答え2

 perl -pe 'chomp unless /^>/; print "\n" if /^>/ and $. > 1' < File1

最後の改行を追加する必要があります。

答え3

解決策awk

awk '/^>/{if(FNR>1)printf "\n";print;next};{printf "%s", $0}' file

perl次のソリューション@chorobaの返信しかし、最終改行文字を処理します。

perl -pe 'chomp unless /^>/ or eof;print "\n" if /^>/ and $. > 1' file

関連情報