単語リストがあります。たとえば、
a=(ENCFF002CDP ENCFF002COQ ENCFF002DAJ ENCFF002DCM)
可能なすべての組み合わせを実行するツールを使用したいと思います。たとえば、次のようになります。
bedtools intersect -a ENCFF002CDP -b ENCFF002COQ > ENCFF002CDP.ENCFF002COQ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DAJ > ENCFF002CDP.ENCFF002DAJ.intersected
可能なすべての組み合わせについてなど。
どうすればいいですか?
答え1
declare -a encode_ids=(ENCFF002CDP ENCFF002COQ ENCFF002DAJ ENCFF002DCM)
for (( i = 0; i < ${#encode_ids[@]}; ++i )); do
for (( j = i + 1; j < ${#encode_ids[@]}; ++j )); do
bedtools intersect -a "${encode_ids[i]}" -b "${encode_ids[j]}" \
>"${encode_ids[i]}.${encode_ids[j]}".intersected
done
done
上記のデュアルループは与えられたIDのすべての組み合わせを提供しますが、同じIDとそれ自体の組み合わせを無視し、組み合わせがすでに使用されているA
場合はIDとそれ自体を組み合わせることを防ぎます。B
B
A
サンプルの配列は次のようにbedtool
実行されます。
bedtools intersect -a ENCFF002CDP -b ENCFF002COQ >ENCFF002CDP.ENCFF002COQ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DAJ >ENCFF002CDP.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DCM >ENCFF002CDP.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DAJ >ENCFF002COQ.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DCM >ENCFF002COQ.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002DAJ -b ENCFF002DCM >ENCFF002DAJ.ENCFF002DCM.intersected
答え2
これはどうですか?
組み合わせ.py
import sys
from itertools import combinations
for i in combinations(sys.stdin.readline().strip().split(" "),2):
print i[0],i[1]
k.sh
#!/usr/bin/env bash
a=(ENCFF002CDP ENCFF002COQ ENCFF002DAJ ENCFF002DCM)
echo "${a[@]}" | python combo.py | while IFS=" " read -r a b
do
echo "bedtools intersect -a $a -b $b > $a.$b.intersected"
done
./k.sh を生成する必要があります。
bedtools intersect -a ENCFF002CDP -b ENCFF002COQ > ENCFF002CDP.ENCFF002COQ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DAJ > ENCFF002CDP.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DCM > ENCFF002CDP.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DAJ > ENCFF002COQ.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DCM > ENCFF002COQ.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002DAJ -b ENCFF002DCM > ENCFF002DAJ.ENCFF002DCM.intersected
答え3
これはawkバージョンです。
システムで bedtools コマンドを実行する必要がある場合は、「echo」と「\\」を削除してください。
$ awk '{
gsub(/[^0-9A-Z ]/,"") # delete unneeded chars like "a=(", ")"
for ( i=1; i < NF; i++) {
for (j=(i+1); j <= NF; j++) {
system("echo bedtools intersect -a "$i" -b "$j" \\> "$i"."$j".intersected")
}
}
}' file
bedtools intersect -a ENCFF002CDP -b ENCFF002COQ > ENCFF002CDP.ENCFF002COQ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DAJ > ENCFF002CDP.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002CDP -b ENCFF002DCM > ENCFF002CDP.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DAJ > ENCFF002COQ.ENCFF002DAJ.intersected
bedtools intersect -a ENCFF002COQ -b ENCFF002DCM > ENCFF002COQ.ENCFF002DCM.intersected
bedtools intersect -a ENCFF002DAJ -b ENCFF002DCM > ENCFF002DAJ.ENCFF002DCM.intersected