ソースコードからドメイン名を徹底的に抽出します。

ソースコードからドメイン名を徹底的に抽出します。

ドメイン名を抽出するためにbashスクリプトを検索してきましたが、それを使用するためのいくつかのヒントを見つけましたが、特定のgrepTLDまたは.comgoogle([A-Za-z\-]*?\\*?)\.com

他のオープンソースプロジェクトに依存するプロジェクトを進めていますが、セキュリティ上の理由から、ソースコード内のすべてのドメイン名を徹底的に検索して抽出したいと思います。

私は次のようなものを使用したいと思います:https://publicsuffix.org/list/public_suffix_list.dat、すべての公開トップレベルドメインのリストであると入力し、すべてのドメインと一致する完全なソースコードから検索して抽出します。public_suffix_list.dat

ポリスチレン

  • public_suffix_list.datコメント付きの行がありますが、それを削除してTLSリストを残すのは簡単です。
  • ソースコードの場合、ソースコード全体を繰り返し繰り返すのにコストがかかりすぎる場合は、ファイルを完全に完成してもかまいません。ファイルリストを作成して1つずつ完成できます。

bashスクリプトでこれは可能ですか?ありがとうございます!

関連情報