![]() |
Как лучше отсеивать поисковых роботов?
Нужно показывать поисковым бота немного другой контент... Как определить, что посетитель сайт - поисковый бот?
|
либо по диапазону его IP (имхо это гавно метод) а второй вариант по юзер агенту
PHP код:
|
по UserAgent
http://devaka.ru/articles/list-of-search-bots например PHP код:
|
По юзер агенту - метод стар как мир, они заходят и под обычным юзер агентом...
Так что лучше делать gethostbyaddr(ip) и смотреть там вхождения на google, yahoo и прочее |
Цитата:
|
ну что то типа того
<?php $hostname = gethostbyaddr($_SERVER['REMOTE_ADDR']); if(strstr($hostname,'google')){ echo $content1; }else{ echo $content2; } ?> |
DNS детектирование согласен это более эффективно но и геморройней по ряду причин но если речь идет о клоакинге то игра стоит свечь но не стоит забывать о том что 100% метода определения поискового бота не существует в природе.
я думаю публике стоит знать зачем TC хочет отлавливать ботов.. тогда и можно будет подобрать самый оптимальный метод. ЗЫ: на самом деле меня тоже волнует этот вопрос.. но мне это требуется только для сбора примерной статистики вот я и машинально предложил палить по юзер агенту |
| Время: 22:48 |