ブラウザの代わりにWgetを使用する必要がある場合はいつですか? Stallmanは、匿名性のためにブラウザの代わりにそれを使用すると聞きました。 Wgetを使用してファイルをインポートするとき、サーバーは何を考えてみますか?
答え1
どのような状況で特定のブラウザよりもWgetを使用する方が良いですか?
~からwget マニュアルページ:
GNU Wgetは、Webから非対話型ファイルをダウンロードするための無料のユーティリティです。 HTTP、HTTPS、FTPプロトコル、HTTPプロキシによる検索もサポートしています。
Wgetは非対話型です。つまり、ユーザーがログインしなくてもバックグラウンドで機能することができます。これにより、検索を開始し、システムから切断し、Wgetにタスクを実行させることができます。一方、ほとんどのWebブラウザはユーザーが常に持っている必要があるため、大量のデータを送信するときに大きな妨害になる可能性があります。
wgetの良いことは、コマンドラインまたはスクリプトで使用でき、バックグラウンドでファイルをダウンロードできることです。
Wgetを使用してファイルをインポートするとき、サーバーは何を考えてみますか?
彼らはそれを他のブラウザと同様にファイルを要求するブラウザとして見ます。
以下はwgetのヘッダーです(サーバーが見るヘッダーです)。
GET / HTTP/1.1
User-Agent: Wget/1.18 (linux-gnu)
Accept: */*
Accept-Encoding: identity
Host: localhost:80
Connection: Keep-Alive
Firefoxのタイトルは次のとおりです。
GET / HTTP/1.1
Host: localhost:80
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:48.0) Gecko/20100101 Firefox/48.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-TW,en-US;q=0.5
Accept-Encoding: gzip, deflate
DNT: 1
Connection: keep-alive
Upgrade-Insecure-Requests: 1
ご覧のとおり、彼らは非常に似ています。
答え2
おそらく最善の主張の1つは、wget
接続が信頼できない場合に再試行し、最後のダウンロードが失敗した場所からダウンロードを続行するようにサーバーに「再インポートする」ように指示する機能です。大容量ファイルをダウンロードする際には大歓迎です。一部のブラウザプラグインもこれを行うことができます。
また、非常に便利な場合は、wget
ディレクトリ全体(サブディレクトリを含む)をダウンロードすることができ、繰り返しダウンロードを避けることができます。
匿名性に関しては非常に相対的です。一般的にwget
このように表示され、かなりの数のサイトはこれが悪いものだと思います。一部のサイトはwgetをブロックします。
ただし、wget
コマンドラインオプションを使用してIDを別の文字列に設定できます--user-agent=agent-string
。 (再び、一部のブラウザプラグインは同様のトリックを使用できます)
したがって、基本的には味の問題です。wget
スクリプトで使いやすいという点については良い主張があるかもしれませんが、ブラウザの場合はもっと複雑です。
答え3
Firefox
グラフィックブラウザ(などChrome
)には、ユーザーを識別するために使用される多くの機能があります。 HTTPヘッダだけではありません。これを「ブラウザ指紋」といいます。
- インストールされたプラグイン
- 現在の画面解像度
- インストールされたフォント
- サポートされる機能
他にもたくさんあります...(注:「私はユニークですか?」、「パノラマパノラマ」、 「ブラウザ流出サイト」 )
CLIブラウザ(wget
などcurl
...)は非常に単純なので、これらの「指紋」はあまりありません。これは匿名性を高め、ユーザーを追跡するのが難しくなります。