~ 105 G
私は多くのコンテンツを含む非常に大きなテキストファイルを持っています<XXXX>
(山かっこはその間のテキストを含みます)。
その括弧とその間のテキストを削除したいと思います。
答え1
「sed」はあなたの友人です。私はかっこを含めたくありません。
注意深い!ファイルが上書きされます。
sed -i 's/<[^>]*>//g' big_file
答え2
XMLファイルと可用性がある場合XMLスター:
$ cat file.xml
<root>
<tag attrib="hello">Hello world</tag>
<tag attrib="nice">Nice to see you</tag>
</root>
$ xmlstarlet sel -t -v / file.xml
Hello world
Nice to see you
これはXMLStarletを使用して、ルートノードとすべての子ノードの値を抽出します。