ファイル内のすべての固有のUnicode文字とその数を表にするツールを知っている人はいますか?
答え1
「Unicode文字」が正確に何を意味するのかわかりません。ファイル内の一意の文字数を数えるには、次のようにします。
$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt
-v FS=""
フィールド区切り文字をスペースに設定します。したがって、各文字は単一のフィールドとして扱われます。各行の文字をリストのキーとして使用してフィールドを繰り返し、増分単位で計算します++
。すべての行を読むと、数のリストを繰り返し、各キー(文字を表す)とその数を印刷します。