ブラウザ以外のクライアントではサイトにアクセスできませんが、Webブラウザを使用してアクセスできます。

Question 1

他の人が指摘したように、ウェブサイトのrobots.txtにこの内容があることを確認してください。

User-Agent: curl
Disallow: /

そこにいる場合、その特定のウェブサイトでカールを使用することはできません

それならこの仕事はできない。どの待つ

User-agent: *
Disallow: /

検索するには、URLの後に/ robots.txtと入力してください。example.com/robots.txt

Answer

他の人が指摘したように、ウェブサイトのrobots.txtにこの内容があることを確認してください。

User-Agent: curl
Disallow: /

そこにいる場合、その特定のウェブサイトでカールを使用することはできません

それならこの仕事はできない。どの待つ

User-agent: *
Disallow: /

検索するには、URLの後に/ robots.txtと入力してください。example.com/robots.txt

Question 2

次のヘッダーを追加してカール要求が機能するようにしました。これらはすべて必要であり、User-Agentヘッダーだけでは不十分です。

> User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:123.0) Gecko/20100101 Firefox/123.0
> Accept-Language: en-US,en;q=0.5
> Accept-Encoding: gzip, deflate, br
> Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8

ブラウザ開発者コンソールの[ネットワーク]タブにあるリクエストヘッダーを見ると、これがわかります。

Acceptヘッダーは単にAccept: */*。

Answer

次のヘッダーを追加してカール要求が機能するようにしました。これらはすべて必要であり、User-Agentヘッダーだけでは不十分です。

> User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:123.0) Gecko/20100101 Firefox/123.0
> Accept-Language: en-US,en;q=0.5
> Accept-Encoding: gzip, deflate, br
> Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8

ブラウザ開発者コンソールの[ネットワーク]タブにあるリクエストヘッダーを見ると、これがわかります。

Acceptヘッダーは単にAccept: */*。

Question 3

私がフォローしているサイトにも同じ問題があります（だから私は最初にあなたに質問をしました。）。奇妙なことは、私がこのサイトをcurl何年も問題なくフォロー（使用）してきたことです。しかし今、これが「問題」になりました！おそらくこれ傾向？

とにかく - あなたの質問を読んだ後、私に適した解決策を見つけました。lynx-「コマンドライン」ブラウザ。lynxオプションが多いので、読書man lynxなどに時間を投資することをお勧めします。私に役立つのは次のとおりです。

lynx -dump -accept_all_cookies 'https://wherever.com/viewtopic.php?t=abc123' > my-dump.txt

Answer

私がフォローしているサイトにも同じ問題があります（だから私は最初にあなたに質問をしました。）。奇妙なことは、私がこのサイトをcurl何年も問題なくフォロー（使用）してきたことです。しかし今、これが「問題」になりました！おそらくこれ傾向？

とにかく - あなたの質問を読んだ後、私に適した解決策を見つけました。lynx-「コマンドライン」ブラウザ。lynxオプションが多いので、読書man lynxなどに時間を投資することをお勧めします。私に役立つのは次のとおりです。

lynx -dump -accept_all_cookies 'https://wherever.com/viewtopic.php?t=abc123' > my-dump.txt

ブラウザ以外のクライアントではサイトにアクセスできませんが、Webブラウザを使用してアクセスできます。

答え1

答え2

答え3

関連情報