forループを使用して、さまざまなファイルから拡張子の前にある4つの任意の文字をどのように削除できますか？

Question 1

次のようにしてみてください。

for forward_read_file in *_1*.fastq; do
   srr=$(echo "$forward_read_file" | cut -d_ -f1)
   rrf_array=( $(find . -name "${srr}_2_*.fastq") )

   case "${#rrf_array[@]}" in
     0) echo "Warning: No reverse read file found for $forward_read_file" > /dev/stderr ;;

     1) reverse_read_file="${rrf_array[1]}"
        perl /home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3
        ;;

     *) echo "Error: multiple reverse read files found for $forward_read_file" > /dev/stderr ;;
   esac

done

これはすべての_1ファイルに対して繰り返されます。cutSRRサンプルIDを抽出するために使用され、このIDは一致するファイルを見つけるfindためにコマンドと共に使用されます_2。 findどのくらいの結果が返されるかわからないので、の出力は配列に格納されます。

一致なし（悪い）、正確に1つの一致（良い、これが私たちが望むもの）、1つ以上の一致（再び悪い）の3つの可能な結果を処理します。

結果が1つしかない場合は、配列から一致するファイルを抽出し、Perlスクリプトを使用して処理します。

結果が0個以上の場合、警告メッセージがstderrに印刷され、次の_1ファイル名で処理が続行されます。必要に応じて、; exit 1これらの状況の前に追加（またはエラーを処理するための他のコード）することができます。;;

_1これは、SRRサンプルIDの先頭と順方向または逆方向のペアファイルで識別されるORを除いて、ファイル名のすべての部分を無視します。_2

if; then; elseちなみに、これはドアの代わりに行うことができますが、ゼロとcaseいくつかのケースを異なる方法で処理するのが便利だと思います。例えば

if [ "${#rrf_array[@]}" == 1 ]; 
  reverse_read_file="${rrf_array[1]}"
  perl /home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3
else
  echo "Warning: unknown problem with reverse read file for $forward_read_file" > /dev/stderr
fi

「問題」ファイルを無視するには、このelseブロックを削除します。

ちなみに、スクリプトを読みやすくするには、スクリプトの上部付近で次のことをお勧めします。

AFilter='/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/AmbiguityFiltering.pl'

それから：

perl "$AFilter" -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3

または、Perlスクリプトが実行可能な場合（たとえば、#!/usr/bin/perlshebang行などを使用してを使用して実行可能フラグを設定する場合chmod +x）、/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming/$ PATHに追加するだけです。

PATH="$PATH:/home/gomeza/shared/sharm646-2021-02-24-09_22/Softwares/NGSQCToolkit_v2.3.3/Trimming"

次のようにスクリプトを実行します。

AmbiguityFiltering.pl -i "$forward_read_file" -irev "$reverse_read_file" -c 1 -t5 -t3

Answer