
番号付きの行を含むファイルがあります。この数字は各行の最初の7つのスペースを占めます。行の残りの部分に重複項目があることを確認し、重複項目のみを出力したいと思います。
たとえば、私のファイルは次のようになります。
1 abcde
2 12345789
3 6789
4 000000
5 abcde
この場合、私の出力は次のようになります。
1 abcde
5 abcde
もちろん出力形式は関係ありませんが、繰り返される文字列を互いに一致させて、より簡単に見つけることができれば良いようです。
私はLinuxを使用しています。
答え1
sort
ファイルの2番目のフィールドを入力し、GNUにuniq
最初の7文字()をスキップして繰り返し行()-s 7
を印刷するように指示します。-D
$ sort -k2,2 foo | uniq -Ds 7
1 abcde
5 abcde