特定の場所からダウンロードしたいいくつかのファイル(.bam形式(バイナリ))があります。 wgetを使用してダウンロードでき、そこから特定の情報を抽出したいと思います。このために私はsamtoolsを使用します。私が知りたいのは、bamファイル全体をダウンロードせずにbamファイルから必要なものをすぐに抽出し、必要なものを抽出してからその内容を削除する方法はありますか?元のbamファイル。
使用されるコマンドは
wget link.bam
samtools view -h chr1 link.bam | samtools view -bS > condensed.bam
完全な元のbamファイルを自分のハードドライブにダウンロードせずにこれを行うことはできますか?スペースが足りなくてファイルが大きいのでこうやりたいです。
あなたに聞いてほしい。
ありがとう
答え1
標準的なアプローチはですwget -O- _url_ | samtools view -h chr1 - | samtools view -bS >condensed.bam
。不明な場合、出力はゼロではなくOです。
次のパイプラインに関連するバイト数がわかっている場合は、他の最適化手順を入手できます。samtools
最初の1352バイトのみが必要であるとします。使用できますcurl
(目安としてこの質問/回答、wget
エラーがあります。 )
curl -r 0-1352 | ...