logo как заработать деньги: СЕО и оптимизация

Плохие новости о гуглботе

Сегодня изучал логи, некоторую приватную информацию и тестировал некоторые инсайдеровские возможности.

Выяснил весьма неприятную вещь.

К примеру, IP 64.233.172.24 принадлежит гуглу, используется для индексации (т.е. это чисто рабочий сервер и на нем работает краулер).

А теперь собстно ахтунг.

В логе за месяц накопилась сотня запросов с этого IP.., при этом используются РАЗНЫЕ юзер агенты (чаще всего маскируется под файрфокс и ИЕ6) и при этом передаются ВСЕ соответствующие этим браузерам хедеры, загружаются ВСЕ включенные файлы (иногда неправильно отрабатывает base href) и отрабатываются ВСЕ редиректы. Т.е. вычислить то, что это гуглбот уже не представляется возможным.

Можно конечно использовать базы ип гугла, но ходят слухи что гугл заключил договор с несколькими ISP о аренде ип адресов. В купе с маскировкой юзерагента это убивает возможность клоакинга на корню.

bog: архив

15 comments for “Плохие новости о гуглботе”

И JS редирект тоже? доры ж тогда помрут и придется ифреймовые доры делать? //:mavook
Выходит что да. //bog

Поизучав СЕРПы на предмет данного ИП, можно сделать вывод что он ТАКЖЕ использовался для GWA (гугл акселератор). Это в принципе обьясняет почему абсолютно все хедеры и другие атрибуты работы настоящего браузера были выдержанны безукоризненно.

Но легче от этого не становится.Исходим из двух получившихся фактов.1.ИП принадлежит серверу который занимается индексацией.2.ИП используется как прокси для запросов от реальных пользователей.И делаем два ВОЗМОЖНЫХ следствия:1.гуглможетвычислятьклоакингсравнивая результаты кеша гуглбота с результатами полученными с прокси.2. гугл может вычислять некачественные страницы анализируя время пребывания и последовательность действий пользователя на странице.Более точные выводы можно былоб сделать если проанализировать достаточно большое кол-во логов с разных доменов.

Так что если у вас есть желание, и вы используете дорвеи с редиректом или клоакингом, проверьте есть ли у вас в логах ип 64.233.172.* и если есть, напишитездеськакидетиндексация наданном домене, и кол-во страниц в индексе.Для выводов нужны как положительные, так и отрицательные данные, так что не стесняйтесь ;)

//bog
Сотня - не маловато ли?Может кто-то сидит в гугле и смотрит порнушку (или что там было на сайте?)Сотня - это чисто html или вместе с картинками и т.д.? //:Anton
Учитывая кол-во страниц на домене с которого все началось, и тем более кол-во трафика, сотня запросов - довольно серьезный показатель.И как я уже сказал, это не просто комп стоящий в гугле. Это ИП машины которая используется при индексации. //bog
Были запросы с этой подсетки, скачивался яваскрипт файл.Но запросов не много и после скачки файла на фид он не переходил. //:hellman
прошу прощения за малоинформативность поста но:думаю клокинг, как технология себя исчерпала, и если у гугли все получится, то эту технологию подхватят и остальные искалки.лед тронулся, пора чесать репы ;) //:ulcer
Да вариантов клоакинга куча.Шифровать яву можно как угодно, открывать .js с “пятого” хоста, на пути фильтровать по юзер агентам, ip, языкам. Можно использовать flash и т.п. технологии. //:хер
у меня доры на фри хостах проследить немогу, ведь проще узнать редиректит бот или нет так, сделайте левую страницу, неизвестную поисковикам и поставте редирект с чегото известного им, а потом логи //:asd
Взяли Internet Explorer, подключили пару своих модулей... все, краулер готов и вычислить бота по логам веб-сервера становится невозможным. Firefox вообще open-source, и сделать из него агента становится еще проще. Поведенческий анализ исходя из таймстемпов “кликов” по ссылкам... пока что ничего иного не приходит в голову. Флеш кажется технологией закрытой, хрен подкопаешься. Но это только на первый взгляд. Скачать swf, раздербанить, проанализировать слои, пройтись кликом по локейшенам и редиректам тоже возможно.Если SE пойдут таким путем, то клоакингу точно конец ;) //Xen
И как это отразилось на выдаче твоего сайта? //:Суппа
Ну вроде положительно. Но так как я много чего менял, то сказать что именно сыграло роль - нельзя. //bog
кто не успел тот опоздал как говорится... //:
Google is the best search engine //:AlbertMills
А кто-нибудь может поделться базой юзер-агентов и айпишников ботовphoto :Aller //:Aller
Что скажешь о Плохие новости о гуглботе?
  Ваше имя
Сейчас популярно:
88 оптимизаторов изучают блог СЕО БоГа про оптимизацию. 93 читают ленту новостей поисковой оптимизации и маркетинга aka SEO & SMM. 36 используют уникальные SMM + SEO скрипты и сервисы для заработка денег.
Подписаться на обновления:
Все новости: оптимизаторы зарабатывают деньги

Получать обновления на email:

Доставляет FeedBurner