![.htaccessを使ってすべてのボットをブロックする方法は? [閉鎖]](https://linux33.com/image/162127/.htaccess%E3%82%92%E4%BD%BF%E3%81%A3%E3%81%A6%E3%81%99%E3%81%B9%E3%81%A6%E3%81%AE%E3%83%9C%E3%83%83%E3%83%88%E3%82%92%E3%83%96%E3%83%AD%E3%83%83%E3%82%AF%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%E3%81%AF%EF%BC%9F%20%5B%E9%96%89%E9%8E%96%5D.png)
すべてのロボットは禁止されていましたが、Bingロボットはルールに従わないため、Bingロボットはrobots.txtルールに従わないことがわかりました。 .htaccessを使っていくつかのロボットをブロックしました。すべてのロボットをブロックするコードはありますか?
答え1
すべてのボットは次のようにブロックする必要が/robots.txt
あります.htaccess
。
# cat robots.txt
User-agent: *
Disallow: /
ファイルは文書のルートになければならず、誰でも読むことができなければなりません。 Webブラウザで開いて確認してください。http://yourdomain/robots.txt
ファイルの内容を提供する必要があります。
技術的には、ボットはそれに従わないかもしれませんが、実際には従うべきです。 Bingがそうだと確信しています。
何らかの理由で(実際のBingを使用する可能性が低い)これがうまくいかない場合は、次のことを試してください。
# cat .htaccess
SetEnvIfNoCase User-Agent .*bot.* search_robot
SetEnvIfNoCase User-Agent .*bing.* search_robot
SetEnvIfNoCase User-Agent .*crawl.* search_robot
Order Deny,Allow
Deny from env=search_robot
Allow from All
mod_setenvif
これを行うには、Apacheモジュールを有効にする必要があります。http://www.askapache.com/htaccess/setenvif.html