
電子メールアカウントがありますが、いよいよ受け取りました。たくさんスパムフォルダに(200,000)個のメッセージがあります。残念ながら、これはすべてスパムではありません。一部はフィルタが正しく訓練されていないため、一部はメーリングリストダイジェストにフィルタを操作する多くのメッセージの1つまたは2つが含まれているためです。
これらの電子メールをダウンロードしたいのですが、電子メールの量が多いため、POPはINBOXとIMAPを除くすべてのフォルダにアクセスできません(サーバーの競合)。
メッセージをスパムから受信トレイに移動するには、Webメールを使用する必要がありました。 「ページが読み込まれるのを待つ」、「すべてのメッセージにフラグを立てる」、「受信トレイを選択」、「フラグ付きメッセージを選択したフォルダに移動する」などを実行しました。 .. ...そして繰り返します!ただし、1ページあたりのメッセージ数は500〜1,000件にすぎず、100,000件のメッセージを移動するには多くの作業が必要です。
これを自動化する良い方法はありますか?
またはとexpect
一緒に使用しようとしましたが、WebメールインターフェースはいくつかのJavaScriptを使用しているので、うまく動作するかどうか疑問に思うかもしれません... 、または(またはそれ自体)スクリプトを介して? lynx
links
wget
chrome
firefox
opera
X
私が本当に探しているのは(私の考えでは)通常のWebブラウザのように動作しますが、スクリプトによって制御される一種の「仮想Webブラウザ」です。
答え1
WebインターフェースがJavaScriptを使用していてJavaScriptなしで実行できない場合は、以下を使用する必要があります。セレン選択したプログラミング言語を直接使用する場合、またはPythonを使用している場合は、抽象化レイヤを使用することもできます。破片。
実行するにはJavaScriptが必要ですが、JavaScriptがまったく必要ないWebサイトはますます一般的になっています。ただし、ブラウザでJavaScriptを一時的にオフにすると簡単に確認できます。 JavaScriptは必要ありませんが、クッキーが必要な場合は、セレンなどのあまり重いメカニズムを使用できます(例:Python +機械化。 URLに加えて、通常はログインからリクエストまで、リクエストからリクエストまでCookieを処理する必要がありますwget
。
別の方法は、問題なく受信トレイをダウンロードできる場合は、受信トレイのメッセージを一時ストアに移動し、すべてのスパムフォルダーの内容を受信トレイに移動し、受信トレイをダウンロードして消去し、受信トレイの一時ストアを復元することです。それから。