ブラウザの代わりにWgetを使用するのはなぜですか? [閉鎖]

ブラウザの代わりにWgetを使用するのはなぜですか? [閉鎖]

ブラウザの代わりにWgetを使用する必要がある場合はいつですか? Stallmanは、匿名性のためにブラウザの代わりにそれを使用すると聞きました。 Wgetを使用してファイルをインポートするとき、サーバーは何を考えてみますか?

答え1

どのような状況で特定のブラウザよりもWgetを使用する方が良いですか?

~からwget マニュアルページ:

GNU Wgetは、Webから非対話型ファイルをダウンロードするための無料のユーティリティです。 HTTP、HTTPS、FTPプロトコル、HTTPプロキシによる検索もサポートしています。

Wgetは非対話型です。つまり、ユーザーがログインしなくてもバックグラウンドで機能することができます。これにより、検索を開始し、システムから切断し、Wgetにタスクを実行させることができます。一方、ほとんどのWebブラウザはユーザーが常に持っている必要があるため、大量のデータを送信するときに大きな妨害になる可能性があります。

wgetの良いことは、コマンドラインまたはスクリプトで使用でき、バックグラウンドでファイルをダウンロードできることです。

Wgetを使用してファイルをインポートするとき、サーバーは何を考えてみますか?

彼らはそれを他のブラウザと同様にファイルを要求するブラウザとして見ます。

以下はwgetのヘッダーです(サーバーが見るヘッダーです)。

GET / HTTP/1.1
User-Agent: Wget/1.18 (linux-gnu)
Accept: */*
Accept-Encoding: identity
Host: localhost:80
Connection: Keep-Alive

Firefoxのタイトルは次のとおりです。

GET / HTTP/1.1
Host: localhost:80
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:48.0) Gecko/20100101 Firefox/48.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-TW,en-US;q=0.5
Accept-Encoding: gzip, deflate
DNT: 1
Connection: keep-alive
Upgrade-Insecure-Requests: 1

ご覧のとおり、彼らは非常に似ています。

答え2

おそらく最善の主張の1つは、wget接続が信頼できない場合に再試行し、最後のダウンロードが失敗した場所からダウンロードを続行するようにサーバーに「再インポートする」ように指示する機能です。大容量ファイルをダウンロードする際には大歓迎です。一部のブラウザプラグインもこれを行うことができます。

また、非常に便利な場合は、wgetディレクトリ全体(サブディレクトリを含む)をダウンロードすることができ、繰り返しダウンロードを避けることができます。

匿名性に関しては非常に相対的です。一般的にwgetこのように表示され、かなりの数のサイトはこれが悪いものだと思います。一部のサイトはwgetをブロックします。

ただし、wgetコマンドラインオプションを使用してIDを別の文字列に設定できます--user-agent=agent-string。 (再び、一部のブラウザプラグインは同様のトリックを使用できます)

したがって、基本的には味の問題です。wgetスクリプトで使いやすいという点については良い主張があるかもしれませんが、ブラウザの場合はもっと複雑です。

答え3

Firefoxグラフィックブラウザ(などChrome)には、ユーザーを識別するために使用される多くの機能があります。 HTTPヘッダだけではありません。これを「ブラウザ指紋」といいます。

  • インストールされたプラグイン
  • 現在の画面解像度
  • インストールされたフォント
  • サポートされる機能

他にもたくさんあります...(注:「私はユニークですか?」「パノラマパノラマ」「ブラウザ流出サイト」 )

CLIブラウザ(wgetなどcurl...)は非常に単純なので、これらの「指紋」はあまりありません。これは匿名性を高め、ユーザーを追跡するのが難しくなります。

関連情報