DASqv -v -H$H -c$cov $db $i | grep Recommend - | sed "s|Recommend ||g" - | sed "s|'||g" -` by itself produces `DAStrim -g20 -b25
私の目標は、前のawk '{print $1 " " $2 " "$3 " $db $i"}'
結果をコマンド全体と組み合わせてそれを出力ファイルにパイプすることです> $(basename $i .las).DAStrim
。
残念ながら、次のコードを使用する代わりbananaDB ./bananaDB.100.las
に結果のみを取得します。DAStrim -g20 -b25 bananaDB ./bananaDB.100.las
#!/bin/bash
db=bananaDB
H=6973
cov=38
for i in $(find . -type f -name "*.*.las");
do
#cat <<EOF
qsub <<EOF
#!/bin/bash -l
#PBS -N DASqv
#PBS -l walltime=48:00:00
#PBS -j oe
#PBS -l mem=1G
#PBS -l ncpus=1
#PBS -M [email protected]
##PBS -m bea
cd \$PBS_O_WORKDIR
source activate thegenemyers
DASqv -v -H$H -c$cov $db $i | grep Recommend - | sed "s|Recommend ||g" - | sed "s|'||g" - | awk '{print $1 " " $2 " "$3 " $db $i"}' > $(basename $i .las).DAStrim
EOF
done
修正する
DASqv -v -H$H -c$cov $db $i
生産:
DASqv -c38 bananaDB ./bananaDB.100.las
Input: 16,450reads, 210,758,575 bases (another 9,934 were < H-length)
Histogram of q-values (average 10 best)
Input QV
50: 1494189 0.2% 380302 18.0%
49: 364713 0.0% 484 0.0%
48: 545846 0.1% 423 0.1%
47: 650479 0.2% 466 0.1%
46: 835282 0.3% 548 0.1%
45: 1054589 0.4% 648 0.1%
44: 1299423 0.5% 775 0.2%
43: 1644281 0.7% 895 0.2%
42: 2036915 0.9% 1193 0.3%
41: 2571126 1.2% 1334 0.4%
40: 3518594 1.5% 1647 0.5%
39: 3641660 1.9% 2046 0.6%
38: 5026473 2.4% 2291 0.7%
37: 6243982 3.1% 2708 0.9%
36: 7600704 3.9% 3301 1.1%
35: 9313754 4.9% 4002 1.3%
34: 11257936 6.0% 4676 1.6%
33: 13508338 7.5% 5544 1.9%
32: 15981847 9.1% 6552 2.3%
31: 18648809 11.1% 7771 2.7%
30: 22290239 13.4% 9124 3.3%
29: 25083448 16.0% 10624 3.9%
28: 29566164 19.1% 12874 4.6%
27: 33339712 22.6% 15482 5.5%
26: 37891335 26.6% 18869 6.6%
25: 44146531 31.2% 23307 7.9%
24: 44948068 35.9% 28142 9.5%
23: 50951224 41.3% 33590 11.5%
22: 55009718 47.1% 42157 13.9%
21: 57456151 53.1% 52181 16.9%
20: 60635065 59.4% 63207 20.6%
19: 58423422 65.6% 76426 25.0%
18: 58472922 71.7% 91565 30.2%
17: 55127848 77.5% 107289 36.4%
16: 50395382 82.7% 123758 43.6%
15: 43893354 87.3% 136465 51.4%
14: 36509552 91.2% 145632 59.8%
13: 28654550 94.2% 145540 68.2%
12: 21245809 96.4% 138232 76.2%
11: 14560980 97.9% 121403 83.2%
10: 9345155 98.9% 98071 88.8%
9: 5395169 99.5% 73996 93.1%
8: 2894210 99.8% 52246 96.1%
7: 1335673 99.9% 33845 98.0%
6: 581470 100.0% 19476 99.2%
5: 201756 100.0% 9367 99.7%
4: 76322 100.0% 3760 99.9%
3: 18979 100.0% 1082 100.0%
2: 4751 100.0% 264 100.0%
1: 456 100.0% 41 100.0%
0: 2686 100.0% 38 100.0%
Recommend 'DAStrim -g20 -b25'
私が逃したものは何ですか?
よろしくお願いします。
答え1
必要以上に仕事を難しくしており、スペースや引用の問題に直面しています。以下を試してください。
ステップ1:コマンドラインに適切なパラメータとファイル名を指定して、1つ以上のデータファイルに対して必要な操作を実行するスタンドアロンスクリプトを作成します。
#!/bin/sh
# use the first 3 arguments for the values to pass to DASqv
db="$1"
H="$2"
cov="$3"
# use shift to get rid of them once we have them in variables, ...
shift 3
# ... so we can loop over the remaining filenames (1 or more) on the command line
for filename in "$@" ; do
outfile="$(basename "$filename" .las).DAStrim"
qsub <<EOF
#!/bin/bash -l
#PBS -N DASqv
#PBS -l walltime=48:00:00
#PBS -j oe
#PBS -l mem=30G
#PBS -l ncpus=1
#PBS -M [email protected]
##PBS -m bea
cd "\$PBS_O_WORKDIR"
source activate thegenemyers
DASqv -v -H"$H" -c"$cov" "$db" "$filename" |
sed -n -e '/Recommend/ {
s/Recommend //;
s/\x27//g;
s:$: "$db" "$filename":;
p
}' > "$outfile"
EOF
done
(sed
中間のスクリプトはすべて1行にすることができますが、追加の改行とインデントを使用すると、機能/実行方法を変更せずに読みやすくなります。16進数を使用してすべての1行\x27
引用符を削除するには注意してください。ASCII0x27
一重引用符文字表現)
たとえば、保存しsubmit-jobs.sh
て実行可能にしますchmod +x submit-job.sh
。
ステップ2:試験を受ける
スクリプトを使用してタスクを手動で送信し、スクリプトが目的のタスクを実行しているかどうかをテストします。たとえば、次のようにします。
/path/to/submit-jobs.sh bananaDB 6973 38 /path/to/somefile.las
必要に応じて、要件を正確に満たすまでスクリプトを変更します。
ステップ3:find
スクリプトを使用して複数のジョブを送信します。
find . -type f -name '*.las' -exec /path/to/submit-jobs.sh bananaDB 6973 38 {} +
ステップ4:find ...
(オプション)手順3を別のパラメータで実行できるスクリプトに変換すると、わずかに異なる値で再実行する必要があるたびにコマンドを入力する必要はありません。例えば
#!/bin/sh
find . -type f -name '*.las' -exec /path/to/submit-jobs.sh "$1" "$2" "$3"
別の名前で保存find-and-submit.sh
し、chmod +x
次を使用して実行可能にする場合:
find-and-submit.sh bananaDB 6973 38
この4段階のスクリプトは変数のforループを提供することもできます。たとえば、パラメータの1つでなくても$cov
35から45の値を持つジョブを送信できます。$cov