Google получил патент на новый метод борьбы со ссылочным спамом

Индексируя и ранжируя различные документы, найденные в сети, и стремясь обеспечить пользователей наиболее релевантной выдачей, поисковая система полагается не только на контент найденных страниц – она также учитывает количество и качество ссылок, ведущих на данную страницу.

Поисковая система – например, Google – может решить, что ваша страница релевантна пользовательскому запросу, основываясь на ее содержимом и на тексте ссылок, указывающих на данную страницу.

Она также может попытаться составить некое представление об «отношениях» между страницами, посмотрев на структуру их ссылочных связей. Для этой цели Google использует систему Pagerank, которая вычисляет меру важности отдельных страниц посредством анализа сети ссылок. Эта мера важности может быть упрощенно представлена как вероятность того, что пользователь окажется на данной странице, случайным образом кликая по ссылкам в процессе  свободного интернет-серфинга.

Итак, на конечное ранжирование страниц влияет комбинация трех основных факторов: релевантность контента страницы введенному запросу, текст ссылок, указывающих на страницу, а также мера важности данной страницы, выводимая из структуры ее ссылочных связей с другими страницами. Google может корректировать ранжирование топовых документов, используя сигналы совсем иной природы, тем не менее именно эти факторы оказывают решающее влияние на то, увидят ли данную страницу конечные пользователи.

Системы ссылочного ранжирования наподобие Pagerank оказываются далеко не идеальным решением. Ссылками можно манипулировать, стремясь вывести ту или иную страницу в топ.

Патент, полученный Google на днях, описывает, как можно выявить и нейтрализовать манипуляции со ссылками и тем самым отсеять из выдачи страницы, получившие высокий Pagerank благодаря ссылочному спаму.

Линкофермы и преступные группы
Поисковая система может посмотреть, не обладают ли ссылки, ведущие на данную страницу, некоторыми специфичными свойствами, которыми вряд ли будут обладать честные ссылки.

В патенте Google выделяется два основных вида ссылочного спама – линкофермы и преступные группы. Далее подробно описывается, как их можно отличить от вполне невинных ссылок, указывающих на вполне невинные страницы.

Линкофермы
Линкоферма состоит из большого количества страничек, созданных в первую очередь для того, чтобы указывать на одну единственную центральную страницу, искусственно увеличивая меру ее важности. Типичным примером может послужить интернет-магазин с множеством скрытых от пользователя сайтов-пустышек, ссылающихся на его главную страницу. Если поисковик сочтет нужным их учитывать эти ссылки, они могут помочь интернет-магазину выбраться в топ.

Страницы, ведущие на центральный ресурс линкофермы, как правило имеют очень низкую степен важности (низкий PageRank). В то же время действительно важные ресурсы скорее всего будут иметь ссылки не только с маловажных страниц, но и с сайтов с высоким  PageRank.

Преступные группы
Преступная группа представляет собой набор страниц, связанных с помощью т.н. кольцевой перелинковки – они активно ссылаются друг на друга, взаимно  увеличивая свой вес и вводя в заблуждение поисковые системы. Если поисковик не суммеет отсеять эти ссылки, подобное поведение будет способствовать нечестному продвижению в топ.

Страницы, образующие преступную группу, не имеют склонности ссылаться куда-либо вовне, за пределы группы. Это позволяет отличить их от нормальных страниц, заработавших свой авторитет честным способом.

Реакция на искуственное увеличение важности
Если какая-либо страница или группа страниц оказалась пойманы на спам-линковке, поисковая система, в соотсветствии с патентом, должна попытаться вычислить количество «искуственно созданной важности» чтоб адекватным образом скорректировать выдачу.

На первом этапе живой человек или специальный алгоритм должны подробно изучить обнаруженные страницы, чтоб убедиться, что они действительно являются спамом. Если проверка дала положительный результат, могут быть приняты следующие меры:

  1. Ссылки, размещенные на данной странице, могут вообще не учитываться в системе Pagerank.
  2. Вес ссылок, размещенных на данной странице, может быть пропорционально  уменьшен (ссылки на другие страницы становятся менее важными).
  3. Ссылки с данной страницы могут получить заранее определенный штраф, уменьшающий их важность.
  4. Важность страницы может быть уменьшена способом, не связанным напрямую с системой Pagerank.
  5. Важность страницы может быть уменьшена способом, не связанным напрямую с системой Pagerank, однако ее ссылки также получат свой штраф.

В патенте излагается математика, лежащая в основе предполагаемых механизмов по обезвреживанию линкоферм и преступных групп. Она стоит того, чтобы ее изучить – особенно если вам действительно интересно, как Google намерен бороться с линк-спамом:

Method for detecting link spam in hyperlinked databases
Invented by Sepandar D. Kamvar, Taher H. Haveliwala, and Glen M. Jeh
Assigned to Google
US Patent 7,509,344
Granted March 24, 2009
Filed August 18, 2004

24 ответов на статью “Google получил патент на новый метод борьбы со ссылочным спамом”

  1. Комментарий от andrew13:

    баян, вообще то, – в плане линкофермы и преступные группы – это прошлый век. Хотя как то давно работали на ура =)

  2. Комментарий от Drunk Monk:

    Нуу, вообще-то это итак очевидно. Схемы из второго примера вообще палятся на раз.
    А вот если у нас 100 линков с 10 сатов пр1, допустим, до достаточно докупить 1-2 десятка троек, несколько четверок и пару пятерок. В результате можем ждать, пока нас высчитатают года до 2015.

    ИМХО :)

  3. Комментарий от Alex:

    Весь потент гугла заключается в добавлении ссылки в панели вебмастера «Пожаловаться на продажные ссылки» ИМХО

  4. Комментарий от Alex:

    Я понял, данный патент является способом естественного отбора оптимизаторов. Самые тупые не выживают :)

  5. Комментарий от Андрей:

    Это называется патент! Теперь гугл себя забанит сам как линкферму:)

  6. Комментарий от Аркадий:

    Хмм. А ведь этот патент является только способом отбора оптимизаторов!

  7. Комментарий от Pit:

    Все-таки хочется посмотреть эту работу в действии. Получить патент – это всего лишь полдела, главное толкого его использовать.

  8. Комментарий от Пацик:

    А кто гуглю патент выдавал?

  9. Комментарий от PowerSeo:

    Method for detecting link spam in hyperlinked databases
    Invented by Sepandar D. Kamvar, Taher H. Haveliwala, and Glen M. Jeh
    Assigned to Google
    US Patent 7,509,344
    Granted March 24, 2009
    Filed August 18, 2004
    2 Пацик – Написано же все.
    Да патент одно, а на практике может оказаться все совсем по-другому.

  10. Комментарий от seoded:

    Т.е. теперь достаточно наставить на конкурента ссылок с нулевых сайтов и он будет в попе? Я так понимаю этот патент.

  11. Комментарий от SunShine:

    так оно и раньше так было (: прикупи пару тысяч говноссылок и вылетаешь из гугли, снимаешь ссылки появляешься обратно (: сам опыты ставил.

  12. Комментарий от lEX:

    я думаю до получения и публикации этого патента он все уже опробовал, и то что должно было слететь уже слетело

  13. Комментарий от миша:

    Спам полностью искоренить им все равно не удастся, а сократить – это уже итак хорошо.

  14. Комментарий от sbseo:

    Весь патент, это привлечение живых людей к борьбе со спамом, вместо тупых роботов. Это мое мнение.

  15. Комментарий от nitroxx:

    Етот патент к одному месту, если он забаянит ссылки появится что то новое, нашы люди не глупы.

  16. Комментарий от richkeeper:

    а мы по-моему всегда что-то придумываем. Обойти ведь патент совсем не трудно.

  17. Комментарий от seo.kg:

    Достаточно хороший метод для того, чтобы бороться со ссылочным спамом! Ведь его так много в сети! Правильно, что решил Google запатентовать этот метод, ведь в наше нелегкое время, стоит появиться хорошей идейки, как она уже всем становится известной!

  18. Комментарий от richkeper:

    как по мне бороться нужно, но не таким методом как у гугла, он мне два блога испортил своим методом, правда восстановил, но осадок неприятный остался.

  19. Комментарий от ирина:

    Думаю это поможет только на первом эпате борьбы. А потом спамеры придумают еще что-то более оригинальное.

  20. Комментарий от Тамара:

    Согласен,спам не победим.И на каждый метод борьбы,придумают новый способ,вот и получается «гонка вооружений».

  21. Комментарий от Mad Max:

    Хе-хе, спам непобедим, пока за него не взялся поисковый гигант. Товарищ Мэтт Кац всех найдёт и обезвредит.
    P.S., вот, недалекие манимейкеры кричат «биржи ссылок непобедимы, ссылки различить нереально». А посмотрите дальше своего носа, Гугл-то их давно поборол.

  22. Комментарий от MoneyCraft:

    Ничего нового не придумали. Всё весьма очевидно. Возможно повысят качество выдачи на время, но на всякое действие найдется противодействие.

  23. Комментарий от alemandre:

    Мне кажется, что это достаточно действенный метод. Наконец гугл начал дергаться в этом направлении.

  24. Комментарий от azimut:

    Главное чтобы сайт на который ведут такие ссылки, не поддавался санкциям, а то можно будет вредить чужим сайтам.

Оставить свой комментарий


Enhanced comment spam protection by PuzzCAPTCHA