開始文字列区切り文字と終了文字区切り文字の間のすべてのテキストを取得します。

Question 1

簡単なsed解決策は

 sed 's/\[protein=\(.*\)]/\1/'

入力のすべての行が同じように見える場合は、上記のコマンドが正しく機能しています。他の種類のデータがあり、上記で得られた結果が気に入らない場合は、目的の結果を指定する必要があります。[protein=something]

Answer

簡単なsed解決策は

 sed 's/\[protein=\(.*\)]/\1/'

入力のすべての行が同じように見える場合は、上記のコマンドが正しく機能しています。他の種類のデータがあり、上記で得られた結果が気に入らない場合は、目的の結果を指定する必要があります。[protein=something]

Question 2

テキストを含めることができるラベルの一般的な回避策は、次のsedコマンドを使用することです。

sed -i.bak 's/\[[^=]*=\([^]]*\)]/\1/g' <file to process>

[tagname=something]このコマンドは、およびで機能し、タグ名では[tagname=なく]何でも構いませんprotein。

-i.bakファイルを処理し、元のファイルを.bak拡張子とともにファイル名に追加します。

Answer

テキストを含めることができるラベルの一般的な回避策は、次のsedコマンドを使用することです。

sed -i.bak 's/\[[^=]*=\([^]]*\)]/\1/g' <file to process>

[tagname=something]このコマンドは、およびで機能し、タグ名では[tagname=なく]何でも構いませんprotein。

-i.bakファイルを処理し、元のファイルを.bak拡張子とともにファイル名に追加します。

Question 3

grep希望のデータを直接出力できます。

$ grep -oP '\[protein=\K((?!]).)+(?=])' file

Answer

grep希望のデータを直接出力できます。

$ grep -oP '\[protein=\K((?!]).)+(?=])' file

関連情報