リストは最初のフィールドに基づいてソートされます。最初のフィールドが同じ行に2番目のフィールドを追加する方法は？

Question 1

ベルトsort+awkパイプ：

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

出力例：

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Answer

ベルトsort+awkパイプ：

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

出力例：

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Question 2

GNUの使用datamash:

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

オプション：

以下を使用してコンマをスペースに変換できますtr。

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

最初のフィールドの出力を並べ替える必要がある場合は、以下を追加してください-s。

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

Answer

GNUの使用datamash:

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

オプション：

以下を使用してコンマをスペースに変換できますtr。

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

最初のフィールドの出力を並べ替える必要がある場合は、以下を追加してください-s。

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

関連情報