文字セットを使用してmuttでメッセージを選択するには?

文字セットを使用してmuttでメッセージを選択するには?

漢字またはキリル文字(ロシア語)を使用するすべてのメッセージはすべてスパムなので、削除マークを付けようとします。

答え1

以下を使用してエンコードをフィルタリングできますfoo~h^content-type:.*foo

しかし、これはかなり制限されています。まず、特定の文字(漢字、キリル文字...)を使用するメッセージをUTF-8でエンコードできます。さらに、添付ファイルを含むメッセージの場合、エンコードはMuttモードの観点の本文であるMIME添付ファイルのヘッダーに割り当てられます。~Bfooただし、この方法は遅くなり、誤検出が発生する可能性があります。これはcontent-type、添付ファイルのタイトルが複数の本文行にある可能性があるためです。

スクリプトを認識するための外部ツールがあるかもしれませんが、これはMuttとは関係ありません。

スパムフィルタリングのためのものであれば、ベイジアンフィルタが適している可能性があります(どのスクリプトであるかを知る必要はありません)。

特定のスクリプトに属する特定の文字の存在をフィルタリングすることもできます。正規表現を使用してUTF-8でエンコードされたすべての中国語文字と一致。これはまだMuttでは動作しませんが(おそらく将来的には)、その間は外部ツールを使用して機能します。

まず、デコードせずにフィルタリングすることも可能です(より高速です)。たとえば、私は現在、postfixでロシアのスパムをフィルタリングするために、次のpcre正規表現(大文字と小文字の区別)を使用しています。

/^Subject:\s*"?=\?[Uu][Tt][Ff]-8\?[Bb]\?(0[J-Z]|(KN|W9)[C-R])/i

関連情報