私のファイルには、カンマで区切られたドメイン名のリストがあります。残念ながら、一部のドメイン名に重複したエントリがあります。
ファイル内の重複したアイテムを見つけて削除する方法はありますか?
サンプル出力は次のとおりです。
culturaurbanashop.com,remaxcorn.info,enjoygoing.com,full-kit-wankers.co.uk,paracaballo.com,radiopozarica.com,sprinklermaps.com,unlock-any-phone.com,voipbillingplus.com,yedincicadde.net,klasseaparte.com,allfortheweb.com,indulgesolutions.com,fastextcafe.info,titi.sickworldhosting.com,kebeico.com,facemowi.it,mellat.info,sal-gov.info,hindustan4848.com,nawaopls.co.za,familie-ries.de
答え1
努力する:
tr ',' '\n' < infile | sort -u | paste -sd, -
答え2
カンマ区切りの単語のリスト(単語はスペースではなくシーケンスです)から重複する項目を削除する必要があることを意味する場合は、次のようになります。
$ echo 2,1,1,2,c,1 a,a,a,b,c | perl -M'List::MoreUtils uniq' -lpe '
s/[\S,]+,[\S,]+/join ",", uniq(split",",$&)/ge'
2,1,c a,b,c