
wget
ネットスケープ形式とは何ですかcookies.txt
?ログインが必要なウェブサイトをミラーリングする必要があります。この形式でCookieを返すChrome拡張機能を使用し、Cookieを保存してコマンドにインポートしますが、機能せずログインしていないかのcookies.txt
ようwget
にコンテンツのみをダウンロードします。
助けてくれてありがとう。
答え1
形式は、マニュアルページに記載されているNetscape形式です。
Netscape の cookie.txt ファイルは次のように構成されます。各行には名前と値のペアが含まれています。サンプルの cookie.txt ファイルには、次の項目が含まれます。
.netscape.com TRUE / FALSE 946684799 NETSCAPE_ID 100103
各行は保存された情報を表します。 ㅏ商標各フィールド間に挿入します。
左から右への各フィールドの意味は次のとおりです。
フィールド- ANDを生成して変数を読み取ることができるドメインです。
バナー- そのドメイン内のすべてのコンピュータが変数にアクセスできるかどうかを示すTRUE / FALSE値。この値は、ドメインに設定した値に応じてブラウザで自動的に設定されます。
道- 変数が有効なドメイン内のパス。
安全- 変数にアクセスするためにドメインへの安全な接続が必要かどうかを示すTRUE / FALSE値。
期限切れ- 変数が期限切れになるUNIX時間。 UNIX時間は、1970年1月1日00:00:00 GMT以降の秒数として定義されます。
名前- 変数の名前です。
値 - 変数の値。
(で」非公式クッキーに関するよくある質問」、明確にするために編集
答え2
HTTP::Cookies::Netscape
各データ行の Netscape Cookie ファイル形式は上記と同じですが、ファイル形式全体に必要な次のヘッダー行がないと読み取れません。
# Netscape HTTP Cookie File
またはこれ:
# HTTP Cookie File
答え3
wgetのCookieを取得する1つの方法は、wgetの--keep-session-cookiesオプションを使用することです。
たとえば、
wget --keep-session-cookies --save-cookies cookies.txt "http://MYSITE/?__login=USER&__password=PASS"
?__login etc
ミラーリングするWebサイトによっては、認証フォームがどのように機能するかを確認したい場合があります。
その後、次のものを使用できます。
wget --mirror --load-cookies cookies.txt http://MYSITE/