15000行と16列のCSVファイルa.csvがあります。別の列に数字、文、日付があります。
次のようになります。
A, B, C, D
a b c d
e f g h
e i j k
a m n k
各列の固有値を個別に計算してすぐに印刷するにはどうすればよいですか?
私は次のような出力が欲しい。
A 2
B 4
C 4
D 3
どんなアドバイスや助けにも感謝します。よろしくお願いします。
答え1
xsvを使用する(https://github.com/BurntSushi/xsv)から始める
A,B,C,D
a,b,c,d
e,f,g,h
e,i,j,k
a,m,n,k
そして走っている
xsv stats input.csv --everything | xsv select field,cardinality >output.txt
あなたはやる
field,cardinality
A,2
B,4
C,4
D,3