
質問を始める前に、まず申し上げたいです。エマルジョン初期ログインに役立ちました。私の問題は以下に説明されています。
ウェブサイトをミラーリングしようとしています。これは私がアカウントを持っていることです。私は選択したツールとしてwgetを使用します。私はカールを試しましたが、投稿データを送信するのは簡単ですが、wgetが現在の作業に適していることがわかりました。
ウェブサイトには、リダイレクトされる初期ログインページがあります。その後、Webサイトのすべてのコンテンツにアクセスできます。長すぎるとログインがタイムアウトしますが、それはすべてです。
以下のwgetコマンドを使用すると、Cookieを正常に保存してロードし、すべてのサブフォルダをダウンロードできます。しかし、私の問題は、各子供が同じログインページを持つindex.htmlを持っていることです。 Cookieがルートフォルダでは正しく機能しますが、その下には何もないようです。
私が使用するコマンドは次のとおりです。
wget http://site.here.com/users/login --save-cookies cookies.txt --post-data '[email protected]&password=*****&remember_me=1' --keep-session-cookies --delete-after
wget http://site.here.com/ --load-cookies cookies.txt --keep-session-cookies -r -np
投稿データの変数/IDは異なるため、その変数/IDが何であるかを確認するには、ログインページをダウンロードする必要があります。
次に、Remember_meの値を1に設定しないと、cookie.txtが異なります。
いいえ Remember_me=1
.here.com TRUE / FALSE numbershere CAKEPHP garbagehere
私を覚えて = 1
site.here.com FALSE / FALSE numbershere CakeCookie[rememberme] garbage
.here.com TRUE / FALSE numbershere CAKEPHP garbagehere
その結果、前者はログインページのみをダウンロードし、後者はログインインデックスを含むサブフォルダを除くすべてのサブフォルダのみをダウンロードします。
少し詰まっています。 wgetとhttpの経験は非常に限られています。この問題を克服するために何をしますか?子供ごとにクッキーを作成しますか?各子のクッキーファイルを手動で生成するのではなく、自動化するにはどうすればよいですか?
PS:これが私が得た答えを反映しているなら、私はLinuxを使っています。