Unix Sed / Awkを使用してXMLファイルの内容を見つける方法は？ [コピー]

Question

sed/awk本当に一般的な表現。確認するstackoverflowに対するこの回答正規表現を使用してHTML / XMLを解析するのはなぜ悪いアイデア。

XMLでは、ドキュメントのDOMを構築してから情報を見つける必要があります。次のcmdlineツールがあります。XMLスターXML文書から情報を取得できます。

ただし、sed / awkを使用してXMLを解析しないでください。

PS：もちろん、実際の生活に触れるファイルに必要な情報を抽出するための単純な正規表現を作成することもできます。たとえば、次は関連情報を含む文書の5行目を印刷します。

# stupid and naive approach:
sed '5!d' MyXML.xml

ただし、これは次のファイルを含むレイアウトの仮定を作成します。何もないXMLに関連しています。特定のファイルに対して非常に特定のジェネレータで動作することはできますが、同じ規則に従うXMLファイルで動作することは保証されません。構造（構造化されたデータはXMLのすべてです）

Answer 1

sed/awk本当に一般的な表現。確認するstackoverflowに対するこの回答正規表現を使用してHTML / XMLを解析するのはなぜ悪いアイデア。

XMLでは、ドキュメントのDOMを構築してから情報を見つける必要があります。次のcmdlineツールがあります。XMLスターXML文書から情報を取得できます。

ただし、sed / awkを使用してXMLを解析しないでください。

PS：もちろん、実際の生活に触れるファイルに必要な情報を抽出するための単純な正規表現を作成することもできます。たとえば、次は関連情報を含む文書の5行目を印刷します。

# stupid and naive approach:
sed '5!d' MyXML.xml

ただし、これは次のファイルを含むレイアウトの仮定を作成します。何もないXMLに関連しています。特定のファイルに対して非常に特定のジェネレータで動作することはできますが、同じ規則に従うXMLファイルで動作することは保証されません。構造（構造化されたデータはXMLのすべてです）

関連情報