Google искусственно продвигает свежие документы


Новогодний логотип Google

В какой-то момент Google значительно увеличил скорость индексации страниц и начал показывать новые документы в результатах поиска через считанные минуты после их публикации. За это пришлось заплатить свою цену. Проблема заключается в том, что только что появившиеся страницы еще не успели обзавестись входящими ссылками, следовательно, проранжировать их оказывается весьма трудно. Поэтому Google начал искусственно раздувать вес недавно созданных страниц, основываясь на исторических данных, а также тех немногочисленных ссылках, которые ему все же удается найти.

В некоторых случаях, когда Google видит, что множество людей начинают вводить запрос, ранее пользовавшийся куда более скромной популярностью, он решает, что недавно случилось нечто важное, и начинает показывать больше недавно созданных страниц.

Сейчас оба нововведения стали особенно очевидны. Если вы отправитесь на домашнюю страницу Google и кликните по праздничному логотипу, посвященному 25-летию со дня создания протокола TCP/IP, а заодно и минувшему Новому году, вы попадете на страницу выдачи по запросу «January 1 TCP/IP». В нормальной ситуации на первом месте будет стоять статья из Википедии. Однако в течение нескольких последних часов первая страница выдачи кардинально изменилась — теперь большая часть позиций приходится на новые документы. В основном это различные спам-сайты, страницы, на которых обсуждается новый логотип Google, а также страницы, цитирующие ту самую википедийную статью. Примечательнее всего то, что на первой позиции находится странци из Digg, ссылающаяся на только что созданный блог с весьма показательным адресом — january-1-tcp-ip.blogspot.com — и прекрасно оптимизированным заголовком (title) — January 1 tcp/ip.

Очевидно, что создатель блога надеялся извлечь свою выгоду из нового логотипа Google, и это ему вполне удалось: два самых топовых результата — страницы на Digg, ссылающиеся на данный блог, вслед за которыми идет главная страница этого блога и страница с одним из его постов.

Сайт получает траффик как напрямую с Digg, так и через домашнюю страницу Google.

С помощью Google Trends мы можем увидеть, что «january 1 tcp/ip» был 31 декабря самым «горячим» запросом в США и что этот запрос продолжает оставаться весьма популярным и сегодня (статья была опубликована 1 января, то есть на следующий день — прим. пер.)

Судя по всему, Google не следует формировать выдачу подобным образом — результаты поиска становятся непредсказуемыми и начинают напоминать явную ошибку в алгоритме ранжирования. В то же время подобный «баг» может стать весьма полезной фичей, если где-нибудь на нашей планете произошло опустошительное землетрясение и люди, услышав об этом в новостях, начали искать более подробную информацию о катастрофе.

Источник (и скриншот выдачи): http://googlesystem.blogspot.com/2008/01/google-artificially-promotes-recent-web.html

5 ответов на статью “Google искусственно продвигает свежие документы”

  1. Комментарий от Дима:

    Я в Поисковой оптимизации несилён но могу сказать что гугл сделало неправильно, Вдруг мне нужно будет найти более хорошую информацию на уже закрепившемся в сети ресурсе, так меня будут направлять в какойто новый, где инфа подаётся совсем другая, Мне кажется это неправильным, лучше оставить то что и было! Хотя это пошло бы на пользу новым ресурсам! Короче я не за не против!

  2. Комментарий от Лютиков:

    > …начал показывать новые документы в результатах поиска…

    А не жуткий ли это баян? Погуглите на тему «google freshness» или «freshrank». Патент июля 2005 года.

  3. Комментарий от Глобатор:

    По-моему, Гугл все делает правильно. Несмотря на скорость индексации новых документов, выдача не страдает. И первоисточник грамотно определяется.

  4. Комментарий от xxax:

    А мне кажется наоборот что уже выдача начала страдать!

  5. Комментарий от antyanesko:

    Хм, с одной стороны это хорошо))) я пару раз искал афиши именно сегоднешнего дня… обновленных вчера.. очень помогло (неожиданный приезд одной группы)

Оставить свой комментарий


Enhanced comment spam protection by PuzzCAPTCHA