
fastqファイルがあり、特定の行の最初の文字を除くすべてのエントリを削除する必要があります。例は次のとおりです。
@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT
+ERR706845.1.1 A202BNABXX:2:1:4523:2219 length=90
@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT
+ERR706845.2.1 A202BNABXX:2:1:4715:2246 length=90
プラス記号は fastq ファイルの行の先頭にあります。その記号で始まる各行について、後ろのすべての+
項目を削除する必要があります。その後、出力を新しいファイルに書き直す必要があります。どんなアドバイスも本当にありがとうございます。とても感謝しています!
答え1
使用sed
$ sed -E 's/^(\+).*/\1/' input_file > new_file
$ cat new_file
@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT
+
@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT
+