awkを使用してファイルの行を変更して操作します。

Question 1

「awkの使い方」について具体的に質問したので

awk -F- '
  /^>/ {hdr=$0; next} 
  {print hdr ORS $1; for(i=2;i<=NF;i++) print hdr"_"i ORS $i}
' file

Answer

「awkの使い方」について具体的に質問したので

awk -F- '
  /^>/ {hdr=$0; next} 
  {print hdr ORS $1; for(i=2;i<=NF;i++) print hdr"_"i ORS $i}
' file

Question 2

>inで始まる行をキャプチャし、さらにheader処理nextするために入力レコードに移動します。headera\nと列1を使用して行を印刷するよりも新しい履歴を入力してください。次に、2番目の列に対してこれを繰り返し、ヘッダーに2を追加します。

$ awk -F- '/^>/{header=$0; next}{print header ORS $1; print header"_2" ORS $2}' file
>M03117:162:000000000-ATLWF:1:1114:22047:12565:307
TCCGAAAGT
>M03117:162:000000000-ATLWF:1:1114:22047:12565:307_2
ACAACGTGT
>M03117:162:000000000-ATLWF:1:2104:9367:8166:307
TTCGAAAGTT
>M03117:162:000000000-ATLWF:1:2104:9367:8166:307_2
GGTGAGGTGTGGG
>M03117:162:000000000-ATLWF:1:1119:11492:8271:307
TCCGAAAGTTCTCCGA
>M03117:162:000000000-ATLWF:1:1119:11492:8271:307_2
CTTGGCTTCCTAG
>M03117:162:000000000-ATLWF:1:2111:19039:8200:307
GACGAAAGTTCACCGATA
>M03117:162:000000000-ATLWF:1:2111:19039:8200:307_2
GAGGTAGAAGGTGCAGTGGGGA

Answer

>inで始まる行をキャプチャし、さらにheader処理nextするために入力レコードに移動します。headera\nと列1を使用して行を印刷するよりも新しい履歴を入力してください。次に、2番目の列に対してこれを繰り返し、ヘッダーに2を追加します。

$ awk -F- '/^>/{header=$0; next}{print header ORS $1; print header"_2" ORS $2}' file
>M03117:162:000000000-ATLWF:1:1114:22047:12565:307
TCCGAAAGT
>M03117:162:000000000-ATLWF:1:1114:22047:12565:307_2
ACAACGTGT
>M03117:162:000000000-ATLWF:1:2104:9367:8166:307
TTCGAAAGTT
>M03117:162:000000000-ATLWF:1:2104:9367:8166:307_2
GGTGAGGTGTGGG
>M03117:162:000000000-ATLWF:1:1119:11492:8271:307
TCCGAAAGTTCTCCGA
>M03117:162:000000000-ATLWF:1:1119:11492:8271:307_2
CTTGGCTTCCTAG
>M03117:162:000000000-ATLWF:1:2111:19039:8200:307
GACGAAAGTTCACCGATA
>M03117:162:000000000-ATLWF:1:2111:19039:8200:307_2
GAGGTAGAAGGTGCAGTGGGGA

Question 3

Perlが救助に来る

perl -laF/-/ -ne '
    if (/^>/) { print; $header = "$_\_2"; }
    else { print join "\n", $F[0], $header, $F[1] }
' -- input-file

-n入力を1行ずつ読みます。
-l入力から改行を削除し、printステートメントに追加します。
-aF/-/入力を次に分割します。-

ヘッダー行を読み取ると、それを出力して後で使用できるようにヘッダーを保存します。シーケンスを処理するとき、最初の部分、保存されたヘッダー、および2番目の部分を印刷します。

Answer

Perlが救助に来る

perl -laF/-/ -ne '
    if (/^>/) { print; $header = "$_\_2"; }
    else { print join "\n", $F[0], $header, $F[1] }
' -- input-file

-n入力を1行ずつ読みます。
-l入力から改行を削除し、printステートメントに追加します。
-aF/-/入力を次に分割します。-

ヘッダー行を読み取ると、それを出力して後で使用できるようにヘッダーを保存します。シーケンスを処理するとき、最初の部分、保存されたヘッダー、および2番目の部分を印刷します。

Question 4

自分で助けたいのですが、プログラミングを学びたくない場合を使用してくださいsed。を使用すると、いつでも次の行を読み取ることができ、二重線を囲んだ部分Nに分割し、必要()に応じて最初の行で参照する部分を結合できます。等\1:

sed -E 'N;s/(.*)(\n)(.*)-(.*)/\1\2\3\2\1_2\2\4/' file

正規表現を拡張せずに（オプションなし-E）これを行うことができますが、バックスラッシュが原因で迷子になることがあります。

sed 'N;s/\(.*\)\(\n\)\(.*\)-\(.*\)/\1\2\3\2\1_2\2\4/' file

保持バッファを使用して同じ結果を得ることができますが、初心者の方はあまり明確ではありませんsed。

sed 'h;n;y/-/\n/;P;s/.*\n//;x;s/$/_2/;G' file

Answer

自分で助けたいのですが、プログラミングを学びたくない場合を使用してくださいsed。を使用すると、いつでも次の行を読み取ることができ、二重線を囲んだ部分Nに分割し、必要()に応じて最初の行で参照する部分を結合できます。等\1:

sed -E 'N;s/(.*)(\n)(.*)-(.*)/\1\2\3\2\1_2\2\4/' file

正規表現を拡張せずに（オプションなし-E）これを行うことができますが、バックスラッシュが原因で迷子になることがあります。

sed 'N;s/\(.*\)\(\n\)\(.*\)-\(.*\)/\1\2\3\2\1_2\2\4/' file

保持バッファを使用して同じ結果を得ることができますが、初心者の方はあまり明確ではありませんsed。

sed 'h;n;y/-/\n/;P;s/.*\n//;x;s/$/_2/;G' file

awkを使用してファイルの行を変更して操作します。

答え1

答え2

答え3

答え4

関連情報