リストを比較し、重複した項目を維持します。 [重複]

リストを比較し、重複した項目を維持します。 [重複]

重複した項目が多数あるリストがあります。たとえば、次のようになります。

AARC
AARC
AARC
TNGT
TNGT
TNGT
CAAC
CAAC

次のような重複していないリストがあります。

AARC
TNGT
YUGT
BATR

など。

最初のリストのすべての項目は2番目のリストに表示されますが、その逆の場合は表示されません。

リストを比較し、両方のリストにいくつの項目があるかどうかを確認したいのですが、重複した項目を保持して識別したいと思います。たとえば、出力は次のようになります。

AARC
AARC
AARC
TNGT
TNGT
TNGT

または

AARC\tAARC
AARC\tAARC
AARC\tAARC
TNGT\tTNGT
TNGT\tTNGT
TNGT\tTNGT

私が経験している問題は、commが最初の重複項目を取得して前方に移動して、後続の項目を未共有項目として計算することです。すべての記事をオンラインで見つけ、重複した記事をアーカイブするのではなく削除できます。この目的に使用できるデータベースがありましたが、最近はデフォルトの動作を変更して重複エントリを削除し、手動で実行できないものは何千ものあります。

答え1

よく理解したら、2番目のリストにない最初のリストのすべての単語をフィルタリングしたいと思います。

あなたはそれを使用することができますgrepそのような理由で。このコマンドは次のとおりです。

grep -w -f list2.txt list1.txt

以下を出力します。

AARC
AARC
AARC
TNGT
TNGT
TNGT

また確認このスレッド

関連情報