一致させる正規表現 = 両方が削除されるように改行文字が続きます

一致させる正規表現 = 両方が削除されるように改行文字が続きます

私はOSXでmail.appメッセージの生のソースコンテンツを扱っていますが、印刷可能なMIME電子メールエンコーディングで引用されたテキストを提供していることがわかりました。したがって、正しいHTMLを取得するには、奇妙な文字をすべて削除する必要があります。

例は次のとおりです。

<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&amp;utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>

これには= CRLFと= 3Dがあります。

この文字をすべて置き換える方法を知っています。 = C3 = A1 = C3 = A9 = C3 = AD = C3 = B3 = C3 = BA = C3 = 81 = C3 = 89 = C3 = 8D = C3 = 93 = C3 = 9A = C3 = B1 = C3 = 91 = 3D =f

=CRLF または '=' の後に改行文字を削除します。

答え1

車輪を再発明する理由は何ですか? qprintすでに存在しています:

Description-en: 印刷エンコーディングを参照するために使用されるエンコーダおよびデコーダ

Qprintは、印刷可能なエンコード(RFC1521)を参照するためにファイルをエンコードまたはデコードできるコマンドラインプログラムです。テキストとバイナリのデータを処理できます。

ホームページ:http://www.fourmilab.ch/webtools/qprint/

入力例:

$ cat nadir.txt 
<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&amp;utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>

出力例:

$ qprint -d nadir.txt 
<p style="margin:1em 0 3px 0;">
<a name="1" style="font-family:Arial, Helvetica, sans-serif;font-size:18px;" href="http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm_source=feedburner&amp;utm_medium=email">Hyundai ya ofrece manuales de los coches con Realidad Aumentada</a>
</p>

qprintほとんどのLinuxディストリビューションでは事前にパッケージ化できます。

MIME::QuotedPrintおよびを含む、引用された印刷可能なテキストをエンコードおよびデコードするためのいくつかのPerlモジュールもありますPerlIO::via::QuotedPrint。間違いなくクイックGoogle検索では、Pythonや他の言語用のQPライブラリも確認できます。

関連情報