xml1.xml
<app>
<bbb>
<jjj>test1</jjj>
</bbb>
<bbb>
<jjj>test2</jjj>
</bbb>
</app>
xml2.xml
ファイル2 xml2.xml
<app>
<bbb>
<jjj>test2</jjj>
</bbb>
<bbb>
<jjj>test3</jjj>
</bbb>
<bbb>
<jjj>test4</jjj>
</bbb>
</app>
2つのファイルを1つのファイルにマージできますか?
<app>
<bbb>
<jjj>test1</jjj>
</bbb>
<bbb>
<jjj>test2</jjj>
</bbb>
<bbb>
<jjj>test3</jjj>
</bbb>
<bbb>
<jjj>test4</jjj>
</bbb>
</app>
答え1
から適応https://stackoverflow.com/questions/10163675/merge-xml-files-in-php
$doc1 = new DOMDocument();
$doc1->load('xml1.xml');
$doc2 = new DOMDocument();
$doc2->load('xml2.xml');
// get 'app' element of document 1
$app1 = $doc1->getElementsByTagName('app')->item(0);
// iterate over 'bbb' elements of document 2
$items2 = $doc2->getElementsByTagName('bbb');
for ($i = 0; $i < $items2->length; $i ++) {
$item2 = $items2->item($i);
// import/copy item from document 2 to document 1
$item1 = $doc1->importNode($item2, true);
// append imported item to document 1 'app' element
$app1 ->appendChild($item1);
}
$doc1->save('merged.xml');
答え2
あなたが作ることができるようですマージ sort
そして整えてください。デフォルトでは、自分が何をしているのかを知っていると仮定し、複数の入力に対してsort
パスを実行して、事前ソート順序が収束したときに入力をインターリーブします。
あなたの例についてGNU -m
ergeが印刷する内容は次のとおりです。sort
<app>
<app>
<bbb>
<bbb>
<jjj>test1</jjj>
</bbb>
<bbb>
<jjj>test2</jjj>
</bbb>
<bbb>
<jjj>test2</jjj>
</bbb>
</app>
<jjj>test3</jjj>
</bbb>
<bbb>
<jjj>test4</jjj>
</bbb>
</app>
だから少なくとも今は折りたたまれていますが、お話したようにまだ整えなければなりません。このsed
スクリプトはあなたの例に対して次のことを行います。
sort -m /tmp/xml[12] |
sed -ne:n -e'$!s|/a..> *$|bbb>|;$p' \
-e'\|^[^>]*b.*\n|{N;P;D;}' \
-eN -e's|\(.*\)\n\(.*\n\)* *\1 *$|\1|' \
-e's|\n|&|3;tD' -ebn -e:D -eP\;D
入力時に少なくとも3行を積み重ね、最初の行がラベルでない場合は、スタックの最初の行を最後の行と比較します<bbb>
。
<app>
<bbb>
<jjj>test1</jjj>
</bbb>
<bbb>
<jjj>test2</jjj>
</bbb>
<bbb>
<jjj>test3</jjj>
</bbb>
<bbb>
<jjj>test4</jjj>
</bbb>
</app>
答え3
「シェル」Linuxは利用できません。 XMLを処理するには本物XMLパーサーが必要です。
ただし、オプションのスクリプトツールはたくさんあります。私が個人的に一番好きなperl
のはXML::Twig
図書館。 (これは「核心」の一部ではありませんが、Unixパッケージマネージャでは非常に一般的です。)
#!/usr/bin/env perl
use strict;
use warnings;
use XML::Twig;
#load both
my $first = XML::Twig->new->parsefile('xml1.xml');
my $second = XML::Twig->new->parsefile('xml2.xml');
#iterate bbb elements in second file
foreach my $bbb ( $second->get_xpath('//bbb') ) {
#extract 'text' of jjj element (of this bbb element)
my $jjj = $bbb->first_child_text('jjj');
#use xpath query to check it doesn't exist first.
if ( not $first->get_xpath("//bbb/jjj[string()='$jjj']") ) {
print $jjj, " not in first, splicing\n";
#cut/paste (note - done in memory, so original file isn't altered)
$bbb->move( 'last_child', $first->root );
}
}
#set output formatting - can do some odd things with particularly strange XMl.
$first->set_pretty_print('indented_a');
$first->print;
## if you want to save it:
open( my $output, '>', "combined.xml" ) or die $!;
print {$output} $first->sprint;
close($output);