右の間の値を抽出したい。
<?xml version="1.0" encoding="UTF-8" standalone="yes"?><HorizonResponse><assignedDevices><assignedDevice><deviceType>EOS</deviceType><assignedProduct><installDate>2019-09-19T00:00:00+02:00</installDate><entitlements>600000001,600000080</entitlements><serviceIDs></serviceIDs>2019-09-19T00:00:00+02:00</installDate><deInstallDate>1753-01-01T00:00:00+01:00</deInstallDate><casIndicator>14</optionQuantity><entitlements>600000300</entitlements><serviceIDs><assignedOption>
...
答え1
XML文書が正しくフォーマットされていると仮定すると(現在5つの閉じたタグが欠落している場合)、これを使用してxmlstarlet
文書内のすべてのノードの値を次のように検索できます。entitlements
$ xmlstarlet sel -t -v '//entitlements' -nl file.xml
600000001,600000080
600000300
特定に関連する値を取得するにはoptionID
:
$ xmlstarlet sel -t -v '//assignedOption[optionID=1000929]/entitlements' -nl file.xml
600000300
答え2
優雅さは欠けていますxmlstarlet
が、このperl
アプローチは必要な出力を返します。
$ perl -ne 'while(m/<entitlements>(.*?)<\/entitlements>/g){print $1," "}' file.xml
600000001,600000080 600000300
awk
方法
$ awk -F\< '{for(a=1;a++<NF;){if($a~/^entitlements>/){print substr($a,14)}}}' file.xml
600000001,600000080
600000300
grep
方法
$ grep -o '<entitlements>[0-9,]*' file.xml|grep -o '[0-9,]*'
600000001,600000080
600000300