大容量（> 2GB）XMLファイルからノードを削除する方法は？

Question 1

awkを使用できます。

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

これにより、インクルード行以降のすべての内容が非表示になり、インクルード<b>行から始まります。</record>

あなたの意見によると、XMLが1つの大きな行である場合は、複数行に分割して変換を完了した後に改行を削除してください。

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

XMLを捨ててYAMLまたはJSONを試してみてください！

Answer

awkを使用できます。

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

これにより、インクルード行以降のすべての内容が非表示になり、インクルード<b>行から始まります。</record>

あなたの意見によると、XMLが1つの大きな行である場合は、複数行に分割して変換を完了した後に改行を削除してください。

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

XMLを捨ててYAMLまたはJSONを試してみてください！

Question 2

個人的には、私はアセンブリの前に最も低いレベル（C）で作業を実行し、libxmlを使用してすべてのノードを繰り返します。

ここにいくつかの例があります。http://www.xmlsoft.org/examples/

GCCを使用してコードをコンパイルします。

Answer

個人的には、私はアセンブリの前に最も低いレベル（C）で作業を実行し、libxmlを使用してすべてのノードを繰り返します。

ここにいくつかの例があります。http://www.xmlsoft.org/examples/

GCCを使用してコードをコンパイルします。

関連情報