一部の単語が大文字で始まり、一部の単語が小文字で始まり、一部の単語が数字または特殊文字で始まるファイルがある場合。を使用すると、sort -u input > output
入力ファイルの文字が出力ファイルの小文字に変換されますか?
何らかの理由でこれが私に起こっているようです。しかし、そうでない場合は、最初の文字が小さすぎる場合は、最初に大文字に変換する方法が必要です。
答え1
sort
大文字と小文字は変更されず、sort
並べ替え以外のデータも変更されません。ただし、sort -u
重複項目は削除されます。
$ for demochar in a b c A B C Ɓ ƀ À à; do printf "%s\n%s\n" "$demochar" "$demochar"; done ) | shuf > input1
$ sort -u input1 > input2
$ sort -uf input1 > input3
$ paste input1 input2 input3
B A a
ƀ B B
C C C
C a à
B b ƀ
b c Ɓ
à À
a à
à ƀ
c Ɓ
c
A
ƀ
Ɓ
a
b
Ɓ
A
À
À
sort -f
〜する比較目的で、すべてを大文字に強制しますが、実際のデータ出力は変更されません。マニュアルから:
-f
、--ignore-case
比較する前に、すべての小文字を対応する大文字に変換します。つまり、大文字と小文字を区別しないソートを実行します。