複数のファイルからファイル名と文字列を抽出する

Question 1

複数のファイルを処理する場合は、一致するgrep項目の前に各ファイル名を印刷します。正規表現を検索する必要がないため、この-Fオプションを使用して固定文字列を検索できます（速度が速い）。この-rオプションはgrep再帰操作を示します。この-rオプションはGNUバージョンなので、grep他のバージョンのgrepがインストールされているシステムでは機能しません。

grep -r -F 'Taxonomy' /path/to/directory

これにより、次の行が表示されます。

sequence.php?ID=gi|90022703|ref|YP_528530.1|:Taxonomy: Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Saccharophagus

これを目的の出力に調整する方法はいくつかありますcut。

grep -r -F 'Taxonomy' /path/to/directory | cut -d = -f 2 | cut -d : -f 1,3

その後、行を次のように変更する必要があります。

gi|90022703|ref|YP_528530.1|: Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Saccharophagus

これは説明する内容とまったく一致しません。| tr -d :本当にコロンを削除したい場合は、チューブの端をそこに置くことができます。最後に、出力をファイルにリダイレクトします。

grep -r -F 'Taxonomy' /path/to/directory | cut -d = -f 2 | cut -d : -f 1,3 > file.txt

>>ファイルを上書きする代わりにファイルに追加するには>。

Answer