ファイルから電子メールを収集する方法は？

Question 1

以下は、以下を使用するソリューションです。grep:

grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" /path/to/file/of/emails/and/such.txt

ファイルのすべてのメールアドレスを取得します。特定のドメインとのみ一致するように正規表現を調整する必要があります。

-E, --extended-regexp は PATTERN を拡張正規表現として解釈します。

-o、--only-matching一致する行のうち、一致する（空でない）部分のみを印刷します。各部分は別々の出力行に表示されます。

Answer

以下は、以下を使用するソリューションです。grep:

grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" /path/to/file/of/emails/and/such.txt

ファイルのすべてのメールアドレスを取得します。特定のドメインとのみ一致するように正規表現を調整する必要があります。

-E, --extended-regexp は PATTERN を拡張正規表現として解釈します。

-o、--only-matching一致する行のうち、一致する（空でない）部分のみを印刷します。各部分は別々の出力行に表示されます。

Question 2

-oパターンと一致する部分だけが印刷されるため、を含むようにパターンを拡張する必要があります@。例のアドレスを使用すると、空白以外の部分をキャプチャできます。

$ grep -oniTE '[^[:blank:]][email protected]'  foo 
  1:    [email protected]
  2:    [email protected]
  3:    [email protected]

しかし、通常、Eメールアドレスは硬い構文解析のために（引用スペースを含めることができます）、上記のコードはいくつかの有効な電子メールアドレスを失います（一部の無効なアドレスも含めて）。たとえば、参照してください。ウィキペディアそして残酷な詳細に関する標準。

Answer

-oパターンと一致する部分だけが印刷されるため、を含むようにパターンを拡張する必要があります@。例のアドレスを使用すると、空白以外の部分をキャプチャできます。

$ grep -oniTE '[^[:blank:]][email protected]'  foo 
  1:    [email protected]
  2:    [email protected]
  3:    [email protected]

しかし、通常、Eメールアドレスは硬い構文解析のために（引用スペースを含めることができます）、上記のコードはいくつかの有効な電子メールアドレスを失います（一部の無効なアドレスも含めて）。たとえば、参照してください。ウィキペディアそして残酷な詳細に関する標準。

関連情報