Google получил патент на новый метод борьбы со ссылочным спамом
Индексируя и ранжируя различные документы, найденные в сети, и стремясь обеспечить пользователей наиболее релевантной выдачей, поисковая система полагается не только на контент найденных страниц – она также учитывает количество и качество ссылок, ведущих на данную страницу.
Поисковая система – например, Google – может решить, что ваша страница релевантна пользовательскому запросу, основываясь на ее содержимом и на тексте ссылок, указывающих на данную страницу.
Она также может попытаться составить некое представление об «отношениях» между страницами, посмотрев на структуру их ссылочных связей. Для этой цели Google использует систему Pagerank, которая вычисляет меру важности отдельных страниц посредством анализа сети ссылок. Эта мера важности может быть упрощенно представлена как вероятность того, что пользователь окажется на данной странице, случайным образом кликая по ссылкам в процессе свободного интернет-серфинга.
Итак, на конечное ранжирование страниц влияет комбинация трех основных факторов: релевантность контента страницы введенному запросу, текст ссылок, указывающих на страницу, а также мера важности данной страницы, выводимая из структуры ее ссылочных связей с другими страницами. Google может корректировать ранжирование топовых документов, используя сигналы совсем иной природы, тем не менее именно эти факторы оказывают решающее влияние на то, увидят ли данную страницу конечные пользователи.
Системы ссылочного ранжирования наподобие Pagerank оказываются далеко не идеальным решением. Ссылками можно манипулировать, стремясь вывести ту или иную страницу в топ.
Патент, полученный Google на днях, описывает, как можно выявить и нейтрализовать манипуляции со ссылками и тем самым отсеять из выдачи страницы, получившие высокий Pagerank благодаря ссылочному спаму.
Линкофермы и преступные группы
Поисковая система может посмотреть, не обладают ли ссылки, ведущие на данную страницу, некоторыми специфичными свойствами, которыми вряд ли будут обладать честные ссылки.
В патенте Google выделяется два основных вида ссылочного спама – линкофермы и преступные группы. Далее подробно описывается, как их можно отличить от вполне невинных ссылок, указывающих на вполне невинные страницы.

Линкофермы
Линкоферма состоит из большого количества страничек, созданных в первую очередь для того, чтобы указывать на одну единственную центральную страницу, искусственно увеличивая меру ее важности. Типичным примером может послужить интернет-магазин с множеством скрытых от пользователя сайтов-пустышек, ссылающихся на его главную страницу. Если поисковик сочтет нужным их учитывать эти ссылки, они могут помочь интернет-магазину выбраться в топ.
Преступные группы
Преступная группа представляет собой набор страниц, связанных с помощью т.н. кольцевой перелинковки – они активно ссылаются друг на друга, взаимно увеличивая свой вес и вводя в заблуждение поисковые системы. Если поисковик не суммеет отсеять эти ссылки, подобное поведение будет способствовать нечестному продвижению в топ.
Страницы, образующие преступную группу, не имеют склонности ссылаться куда-либо вовне, за пределы группы. Это позволяет отличить их от нормальных страниц, заработавших свой авторитет честным способом.
Реакция на искуственное увеличение важности
Если какая-либо страница или группа страниц оказалась пойманы на спам-линковке, поисковая система, в соотсветствии с патентом, должна попытаться вычислить количество «искуственно созданной важности» чтоб адекватным образом скорректировать выдачу.
На первом этапе живой человек или специальный алгоритм должны подробно изучить обнаруженные страницы, чтоб убедиться, что они действительно являются спамом. Если проверка дала положительный результат, могут быть приняты следующие меры:
- Ссылки, размещенные на данной странице, могут вообще не учитываться в системе Pagerank.
- Вес ссылок, размещенных на данной странице, может быть пропорционально уменьшен (ссылки на другие страницы становятся менее важными).
- Ссылки с данной страницы могут получить заранее определенный штраф, уменьшающий их важность.
- Важность страницы может быть уменьшена способом, не связанным напрямую с системой Pagerank.
- Важность страницы может быть уменьшена способом, не связанным напрямую с системой Pagerank, однако ее ссылки также получат свой штраф.
В патенте излагается математика, лежащая в основе предполагаемых механизмов по обезвреживанию линкоферм и преступных групп. Она стоит того, чтобы ее изучить – особенно если вам действительно интересно, как Google намерен бороться с линк-спамом:
Method for detecting link spam in hyperlinked databases
Invented by Sepandar D. Kamvar, Taher H. Haveliwala, and Glen M. Jeh
Assigned to Google
US Patent 7,509,344
Granted March 24, 2009
Filed August 18, 2004

Май 5-ое, 2009 | 12:28 пп
баян, вообще то, – в плане линкофермы и преступные группы – это прошлый век. Хотя как то давно работали на ура =)
Май 5-ое, 2009 | 1:09 пп
Нуу, вообще-то это итак очевидно. Схемы из второго примера вообще палятся на раз.
А вот если у нас 100 линков с 10 сатов пр1, допустим, до достаточно докупить 1-2 десятка троек, несколько четверок и пару пятерок. В результате можем ждать, пока нас высчитатают года до 2015.
ИМХО :)
Май 7-ое, 2009 | 12:10 дп
Весь потент гугла заключается в добавлении ссылки в панели вебмастера «Пожаловаться на продажные ссылки» ИМХО
Май 7-ое, 2009 | 2:25 пп
Я понял, данный патент является способом естественного отбора оптимизаторов. Самые тупые не выживают :)
Май 8-ое, 2009 | 12:27 пп
Это называется патент! Теперь гугл себя забанит сам как линкферму:)
Май 14-ое, 2009 | 3:34 пп
Хмм. А ведь этот патент является только способом отбора оптимизаторов!
Май 18-ое, 2009 | 11:16 дп
Все-таки хочется посмотреть эту работу в действии. Получить патент – это всего лишь полдела, главное толкого его использовать.
Май 19-ое, 2009 | 5:42 дп
А кто гуглю патент выдавал?
Май 20-ое, 2009 | 3:10 пп
Method for detecting link spam in hyperlinked databases
Invented by Sepandar D. Kamvar, Taher H. Haveliwala, and Glen M. Jeh
Assigned to Google
US Patent 7,509,344
Granted March 24, 2009
Filed August 18, 2004
2 Пацик – Написано же все.
Да патент одно, а на практике может оказаться все совсем по-другому.
Май 22-ое, 2009 | 12:31 дп
Т.е. теперь достаточно наставить на конкурента ссылок с нулевых сайтов и он будет в попе? Я так понимаю этот патент.
Май 25-ое, 2009 | 11:41 дп
так оно и раньше так было (: прикупи пару тысяч говноссылок и вылетаешь из гугли, снимаешь ссылки появляешься обратно (: сам опыты ставил.
Май 26-ое, 2009 | 2:54 пп
я думаю до получения и публикации этого патента он все уже опробовал, и то что должно было слететь уже слетело
Май 28-ое, 2009 | 12:58 пп
Спам полностью искоренить им все равно не удастся, а сократить – это уже итак хорошо.
Июнь 1-ое, 2009 | 12:20 пп
Весь патент, это привлечение живых людей к борьбе со спамом, вместо тупых роботов. Это мое мнение.
Июнь 3-ое, 2009 | 8:08 пп
Етот патент к одному месту, если он забаянит ссылки появится что то новое, нашы люди не глупы.
Июнь 9-ое, 2009 | 1:05 дп
а мы по-моему всегда что-то придумываем. Обойти ведь патент совсем не трудно.
Июнь 15-ое, 2009 | 4:47 пп
Достаточно хороший метод для того, чтобы бороться со ссылочным спамом! Ведь его так много в сети! Правильно, что решил Google запатентовать этот метод, ведь в наше нелегкое время, стоит появиться хорошей идейки, как она уже всем становится известной!
Июнь 18-ое, 2009 | 5:06 дп
как по мне бороться нужно, но не таким методом как у гугла, он мне два блога испортил своим методом, правда восстановил, но осадок неприятный остался.
Июнь 18-ое, 2009 | 1:04 пп
Думаю это поможет только на первом эпате борьбы. А потом спамеры придумают еще что-то более оригинальное.
Июнь 18-ое, 2009 | 8:45 пп
Согласен,спам не победим.И на каждый метод борьбы,придумают новый способ,вот и получается «гонка вооружений».
Июнь 20-ое, 2009 | 11:43 дп
Хе-хе, спам непобедим, пока за него не взялся поисковый гигант. Товарищ Мэтт Кац всех найдёт и обезвредит.
P.S., вот, недалекие манимейкеры кричат «биржи ссылок непобедимы, ссылки различить нереально». А посмотрите дальше своего носа, Гугл-то их давно поборол.
Июнь 20-ое, 2009 | 10:24 пп
Ничего нового не придумали. Всё весьма очевидно. Возможно повысят качество выдачи на время, но на всякое действие найдется противодействие.
Июнь 22-ое, 2009 | 8:29 пп
Мне кажется, что это достаточно действенный метод. Наконец гугл начал дергаться в этом направлении.
Июль 22-ое, 2009 | 10:49 дп
Главное чтобы сайт на который ведут такие ссылки, не поддавался санкциям, а то можно будет вредить чужим сайтам.