Google искусственно продвигает свежие документы
В какой-то момент Google значительно увеличил скорость индексации страниц и начал показывать новые документы в результатах поиска через считанные минуты после их публикации. За это пришлось заплатить свою цену. Проблема заключается в том, что только что появившиеся страницы еще не успели обзавестись входящими ссылками, следовательно, проранжировать их оказывается весьма трудно. Поэтому Google начал искусственно раздувать вес недавно созданных страниц, основываясь на исторических данных, а также тех немногочисленных ссылках, которые ему все же удается найти.
В некоторых случаях, когда Google видит, что множество людей начинают вводить запрос, ранее пользовавшийся куда более скромной популярностью, он решает, что недавно случилось нечто важное, и начинает показывать больше недавно созданных страниц.
Сейчас оба нововведения стали особенно очевидны. Если вы отправитесь на домашнюю страницу Google и кликните по праздничному логотипу, посвященному 25-летию со дня создания протокола TCP/IP, а заодно и минувшему Новому году, вы попадете на страницу выдачи по запросу «January 1 TCP/IP». В нормальной ситуации на первом месте будет стоять статья из Википедии. Однако в течение нескольких последних часов первая страница выдачи кардинально изменилась — теперь большая часть позиций приходится на новые документы. В основном это различные спам-сайты, страницы, на которых обсуждается новый логотип Google, а также страницы, цитирующие ту самую википедийную статью. Примечательнее всего то, что на первой позиции находится странци из Digg, ссылающаяся на только что созданный блог с весьма показательным адресом — january-1-tcp-ip.blogspot.com — и прекрасно оптимизированным заголовком (title) — January 1 tcp/ip.
Очевидно, что создатель блога надеялся извлечь свою выгоду из нового логотипа Google, и это ему вполне удалось: два самых топовых результата — страницы на Digg, ссылающиеся на данный блог, вслед за которыми идет главная страница этого блога и страница с одним из его постов.
Сайт получает траффик как напрямую с Digg, так и через домашнюю страницу Google.
С помощью Google Trends мы можем увидеть, что «january 1 tcp/ip» был 31 декабря самым «горячим» запросом в США и что этот запрос продолжает оставаться весьма популярным и сегодня (статья была опубликована 1 января, то есть на следующий день — прим. пер.)
Судя по всему, Google не следует формировать выдачу подобным образом — результаты поиска становятся непредсказуемыми и начинают напоминать явную ошибку в алгоритме ранжирования. В то же время подобный «баг» может стать весьма полезной фичей, если где-нибудь на нашей планете произошло опустошительное землетрясение и люди, услышав об этом в новостях, начали искать более подробную информацию о катастрофе.
Источник (и скриншот выдачи): http://googlesystem.blogspot.com/2008/01/google-artificially-promotes-recent-web.html


Январь 28-ое, 2008 | 12:43 пп
Я в Поисковой оптимизации несилён но могу сказать что гугл сделало неправильно, Вдруг мне нужно будет найти более хорошую информацию на уже закрепившемся в сети ресурсе, так меня будут направлять в какойто новый, где инфа подаётся совсем другая, Мне кажется это неправильным, лучше оставить то что и было! Хотя это пошло бы на пользу новым ресурсам! Короче я не за не против!
Февраль 4-ое, 2008 | 1:57 дп
> …начал показывать новые документы в результатах поиска…
А не жуткий ли это баян? Погуглите на тему «google freshness» или «freshrank». Патент июля 2005 года.
Февраль 5-ое, 2008 | 8:10 дп
По-моему, Гугл все делает правильно. Несмотря на скорость индексации новых документов, выдача не страдает. И первоисточник грамотно определяется.
Февраль 7-ое, 2008 | 2:28 дп
А мне кажется наоборот что уже выдача начала страдать!
Март 12-ое, 2008 | 6:57 пп
Хм, с одной стороны это хорошо))) я пару раз искал афиши именно сегоднешнего дня… обновленных вчера.. очень помогло (неожиданный приезд одной группы)