テキストファイルがたくさんあります。各記事はで区切ります15 stopwords
。このファイルでは、以下を除く単語の総数を知りたいと思います。stopword
答え1
GNUの使用grep
:
grep -Eo '\S+' < file | grep -vcxF stopword
-c
()単語数を数えます。言葉少なくとも有効なテキストでは、正確に()ではwc -w
なく一連の空白ではない文字()です\S+
。-v
-xF
stopword
答え2
単語数からs数をinput
引いた値(使用stopword
GNU grep-o
、Linuxタグを指定したので):
echo $(( $(wc -w < input) - $( grep -o stopword input | wc -l ) ))
入力例:
I have the large set of the text file. In that, each article is separated by 15 stopwords. I want to find out the total number of words count in that file excluding the stopword.
stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword
I have the large set of the text file. In that, each article is separated by 15 stopwords. I want to find out the total number of words count in that file excluding the stopword.
出力:
$ echo $(( $(wc -w < input) - $( grep -o stopword input | wc -l ) ))
66
答え3
awk '{ gsub("stopword",""); words+=NF }; END { print words; }' /text/file
awk
関連するすべてのフィールドの内容を計算します。意味ではそういう言葉ではないけど
- ハイフン
- スペースの後にピリオドを追加する(文が正しくありません。次の文)
- タイトルの数(1.はじめに)