ゲノムの各場所のゲノムの適用範囲を指定するベッドファイルのゲノム_cov.bedがあります。柱は足場、位置、適用範囲です。
scaffold_1 1 0
scaffold_1 2 0
scaffold_1 3 32
scaffold_1 4 34
scaffold_1 5 34
scaffold_1 6 39
scaffold_1 7 39
scaffold_1 8 53
scaffold_1 9 58
scaffold_1 10 60
2番目の列を繰り返す別のベッドファイルを作成したいと思います。
cut -fを使用すると列をコピーできず、awkコマンドを使用した場合:
awk '{print $1,$2,$2,$3}' genome_cov.bed > genome_cov2.bed
ベッドファイルは作成されず、最終的には次のように表示されます。
scaffold_1 1 1 0
scaffold_1 2 2 0
scaffold_1 3 3 32
scaffold_1 4 4 34
scaffold_1 5 5 34
scaffold_1 6 6 39
scaffold_1 7 7 39
scaffold_1 8 8 53
scaffold_1 9 9 58
scaffold_1 10 10 60
答え1
設定できます出力フィールド区切り記号タブ:
awk '{print $1,$2,$2,$3}' OFS='\t' genome_cov.bed
またはprintf
形式を明示的に指定する場合
awk '{printf "%s\t%s\t%s\t%s\n",$1,$2,$2,$3}' genome_cov.bed