ユーザーが指定した単語を除くテキストファイルの単語数を見つける方法

ユーザーが指定した単語を除くテキストファイルの単語数を見つける方法

テキストファイルがたくさんあります。各記事はで区切ります15 stopwords。このファイルでは、以下を除く単語の総数を知りたいと思います。stopword

答え1

GNUの使用grep:

grep -Eo '\S+' < file | grep -vcxF stopword

-c()単語数を数えます。言葉少なくとも有効なテキストでは、正確に()ではwc -wなく一連の空白ではない文字()です\S+-v-xFstopword

答え2

単語数からs数をinput引いた値(使用stopwordGNU grep-o、Linuxタグを指定したので):

echo $(( $(wc -w < input) - $( grep -o stopword input | wc -l ) ))

入力例:

I have the large set of the text file. In that, each article is separated by 15 stopwords. I want to find out the total number of words count in that file excluding the stopword.
stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword stopword
I have the large set of the text file. In that, each article is separated by 15 stopwords. I want to find out the total number of words count in that file excluding the stopword.

出力:

$ echo $(( $(wc -w < input) - $( grep -o stopword input | wc -l ) ))
66

答え3

awk '{ gsub("stopword",""); words+=NF }; END { print words; }' /text/file

awk関連するすべてのフィールドの内容を計算します。意味ではそういう言葉ではないけど

  • ハイフン
  • スペースの後にピリオドを追加する(文が正しくありません。次の文)
  • タイトルの数(1.はじめに)

関連情報