grep は複数の正規表現を検索し、発生回数を計算します。

Question 1

おそらくawk最速のシェルツールです。あなたは試すことができます：

awk "/$regex1/ { ++r1 }
     /$regex2/ { ++r2 }"'
     END { print "regex1:",r1 "\nregex2:",r2 }' <infile

perlもちろん、あなたの質問のように正規表現を使用する必要がある場合は、perlそれが唯一の答えです。ただし、基本式の代わりにawk拡張式（たとえば）を使用します。grep -E

Answer

おそらくawk最速のシェルツールです。あなたは試すことができます：

awk "/$regex1/ { ++r1 }
     /$regex2/ { ++r2 }"'
     END { print "regex1:",r1 "\nregex2:",r2 }' <infile

perlもちろん、あなたの質問のように正規表現を使用する必要がある場合は、perlそれが唯一の答えです。ただし、基本式の代わりにawk拡張式（たとえば）を使用します。grep -E

Question 2

私が考えることができる最も速い解決策は柔軟。テストされていないスケルトンは次のとおりです。

%{
  int count[1000];
%}
%%

regex0  {count[0]++; }
regex1  {count[1]++; }
...
.|\n    {}

%%
int main(){
   yylex();
   // printf the counts;
}

flexはオートマタを最適化し、高速Cコードを生成するのに非常に効果的です。

正規表現が変更されたら、再コンパイルする必要があります。

編集する：どのようなソリューションを実装して試してみると、時間を見ているのも面白いでしょう。

Answer