私はOSXでmail.appメッセージの生のソースコンテンツを扱っていますが、印刷可能なMIME電子メールエンコーディングで引用されたテキストを提供していることがわかりました。したがって、正しいHTMLを取得するには、奇妙な文字をすべて削除する必要があります。
例は次のとおりです。
<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>
これには= CRLFと= 3Dがあります。
この文字をすべて置き換える方法を知っています。 = C3 = A1 = C3 = A9 = C3 = AD = C3 = B3 = C3 = BA = C3 = 81 = C3 = 89 = C3 = 8D = C3 = 93 = C3 = 9A = C3 = B1 = C3 = 91 = 3D =f
=CRLF または '=' の後に改行文字を削除します。
答え1
車輪を再発明する理由は何ですか? qprint
すでに存在しています:
Description-en: 印刷エンコーディングを参照するために使用されるエンコーダおよびデコーダ
Qprintは、印刷可能なエンコード(RFC1521)を参照するためにファイルをエンコードまたはデコードできるコマンドラインプログラムです。テキストとバイナリのデータを処理できます。
入力例:
$ cat nadir.txt
<p style=3D"margin:1em 0 3px 0;">
<a name=3D"1" style=3D"font-family:Arial, Helvetica, sans-serif;font-size:1=
8px;" href=3D"http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm=
_source=3Dfeedburner&utm_medium=3Demail">Hyundai ya ofrece manuales de =
los coches con Realidad Aumentada</a>
</p>
出力例:
$ qprint -d nadir.txt
<p style="margin:1em 0 3px 0;">
<a name="1" style="font-family:Arial, Helvetica, sans-serif;font-size:18px;" href="http://feedproxy.google.com/~r/WwwhatsNew/~3/8BdOd-xRTU4/?utm_source=feedburner&utm_medium=email">Hyundai ya ofrece manuales de los coches con Realidad Aumentada</a>
</p>
qprint
ほとんどのLinuxディストリビューションでは事前にパッケージ化できます。
MIME::QuotedPrint
およびを含む、引用された印刷可能なテキストをエンコードおよびデコードするためのいくつかのPerlモジュールもありますPerlIO::via::QuotedPrint
。間違いなくクイックGoogle検索では、Pythonや他の言語用のQPライブラリも確認できます。