PageRаnk и позиция в выдаче: немного статистики
Представляем вашему вниманию анонсированный перевод аналитического исследования поведения Google Toolbar Pagerank.
В течение нескольких последних месяцев команда HTML4SEO провела тысячи обзоров выдачи Google. В ходе каждого обзора мы проверяли PageRank, количество входящих ссылок а также HTML-контент страниц, входящих в первую сотню списка выдачи Google. Мы публикуем небольшое статистическое исследование, основанное на полученных данных, в сопровождении некоторых выводов.
Этот текст посвящен только параметру PageRank. В скором времени мы планируем опубликовать два других исследования, в которых будет рассмотрено значение входящих ссылок и свойств HTML-контента — двух других важнейших факторов SEO.
Эволюция PageRank в выдаче Google в течение последних 6 месяцев





Корреляция между ранжированием и параметром PageRank
Наиболее распространенным методом расчета корреляции ρXY между величинами X и Y является коэффициент корреляции Браве-Пирсона, нередко называемый просто коэффициентом корреляции.
Коэффициент корреляции ρXY может варьироваться в пределах от +1 до -1. Если ρXY = 1 корреляция считается полностью положительной, если -1 — полностью отрицательной. В обоих случаях, зная значение X, мы можем точно определить значение Y и наоборот. На графике этим коэффициентам будут соответствовать точки (X, Y), выстроенные по прямой линии, при этом график может возрастать (положительная корреляция) или убывать (отрицательная корреляция).
Если ρXY = 0, то между переменными X и Y нет линейной зависимости, при этом они могут быть полностью независимы друг от друга, или же между ними может существовать некая сложная, нелинейная зависимость.
В нашем случае величинам X и Y соответствует конечное ранжирование (позиция в выдаче Google) и коэффициент PageRank (по тулбару). Ниже приведены данные, собранные в ходе 1000 первых обзоров (100 лучших позиций в выдаче Google по запросам с количеством результатов больше 100), которые делались каждый месяц в период с мая по октябрь 2007 г.
| 2007 | коэффициент корреляции |
| Май | -0,85 |
| Июнь | -0,88 |
| Июль | -0,90 |
| Август | -0,88 |
| Сентябрь | -0,86 |
| Октябрь | -0,88 |
| Среднее арифметическое | -0,88 |
| Стандартное отклонение | 0,02 |
Комментарии:
1-е наблюдение. Коэффициент корреляции между ранжированием и PageRank близок к единице (в абсолютном выражении). Ранжирование и PageRank сильно коррелируют друг с другом. Высокий PageRank несомненно улучшает ранжирование.
2-е наблюдение. Коэффициент корреляции между ранжированием и PageRank демонстрирует высокую стабильность, имея среднее значение в 0,88 при стандартном отклонении в 2%. Вес параметра PageRank в рамках алгоритма ранжирования Google скорее всего не менялся. Ранжирование зависит от PageRank.
Утверждения типа «PageRank мертв!» или «PageRank имеет отношение только к маркетингу» не соответствуют действительности. PageRank не умер, его значение не уменьшилось до чисто маркетингового индикатора — он остается весьма существенной частью алгоритма ранжирования Google.
Линейная интерполяция ранжирования и PageRank
Теперь обратимся к линейной регрессии:
(Речь идет об анализе совокупности линейных функций типа f(x) = Ax + B, при этом коэффициент A, равный тангенсу угла наклона линии соответствующего графика, именуется в оригинальном тексте параметром «A slope», а коэффициент В, указывающий на ординату точки пересечения графика с осью Y – «B Y-intercept», смысл этого коэффициента – средний (по разным запросам) PageRank страницы занимающей первую позицию в выдаче; мы оставляем эти наименования без изменений, заключая их в кавычки для удобства чтения — Прим. пер.)
| Линейная регрессия | A slope | В Y-intercept | |
| Май | y = -0,01x + 3,42 | -0,01 | 3,42 |
| Июнь | y = -0,01x + 3,39 | -0,01 | 3,39 |
| Июль | y = -0,01x + 3,31 | -0,01 | 3,31 |
| Август | y = -0,01x + 3,20 | -0,01 | 3,20 |
| Сентябрь | y = -0,01x + 3,15 | -0,01 | 3,15 |
| Октябрь | y = -0,01x + 3,13 | -0,01 | 3,13 |
Комментарии:
1-е наблюдение. Коэффициент «A Slope» (http://en.wikipedia.org/wiki/Linear_function) остается постоянным и равняется 1/100, что соответствует падению PageRank на 1 единицу при ухудшении ранжирования на 100 позиций. В течение последних нескольких месяцев эта картина оставалась неизменной.
2-е наблюдение. Коэффициент «B Y-intercept» (линейная интерполяция PageRank, соответствующего первому месту в выдаче) уменьшается. Другими словами, требования по параметру PageRank к сайтам, попадающим в топ выдачи Google, с каждым месяцем становятся все менее строгими.
Изменения Y-intercept линейной регрессии ранжирования и PageRank
Распределение значений Y-intercept линейной регрессии по временной шкале, охватывающей период с мая по октябрь 2007 г., демонстрирует корреляцию в -0,98, что является признаком очень тесной линейной зависимости между двумя переменными. Соответствующая линейная регрессия выражается формулой y = -0,07x + 3,49. Из нее можно без труда вывести, что требования по PageRank к сайтам, попадающим в топ выдачи, уменьшаются на 1 единицу PageRank каждые 14 месяцев.
К представленным результатам следует относиться с известной долей сомнения. Они были получены статистическим методом, следовательно их можно рассматривать лишь как индикатор самых общих тенденций — не более того. И все же они представляют немалый интерес.
Чем может быть обусловлено падение PageRank в выдаче Google?
По мере роста всемирной сети количество релевантных документов с низким PageRank увеличивается. Среди огромного корпуса доступных страниц всегда найдется значительное число документов, выделяющихся своим качеством, но вместе с тем имеющих низкий PageRank и малое количество входящих ссылок. Это обстоятельство по-новому ставит вопрос о семантической релевантности возвращаемых Google страниц.
Возможно, несколько месяцев назад Google попросту начал отслеживать сайты на предмет подозрительных (black hat) входящих ссылок. Ссылок, которые рассматриваются как благонадежные, становится все меньше и меньше и прежние лидеры выдачи сменились прошлыми аутсайдерами с меньшим количеством обратных ссылок (и соответственно PageRank) зато их более высоким «качеством».
Такие изменения значения Pagerank сайтов из выдачи Google могли стать возможными потому что алгоритм вычисления Pagerank глобальный и учитывает все ссылки, а не только ссылки между тематически близкими сайтами.
Или: несколько месяцев назад началась масштабная рекалибровка PageRank (кое-кто высказывал и такое предположение). Недавний апдейт индикатора, заметный невооруженным глазом, подтверждает эту гипотезу, поскольку процесс рекалибровки должен включать в себя глобальное падение PageRank до квази-начального уровня.
Вероятно, существует множество других гипотез…
PageRank в ноябре 2007 г.
Похоже, что в ходе этого месяца произошли более радикальные изменения, нежели в течение нескольких предыдущих месяцев. У кого-то PageRank вырос сразу на 3 пункта, у кого-то — упал на эту же величину. При этом изменения PageRank носят нелинейный характер. Поскольку между конечным ранжированием и значением PageRank существует очень сильная корреляция, те, у кого PageRank обвалился, имеют вполне реальную почву для беспокойства. За уменьшением PageRank непременно последует потеря позиций в выдаче Google и, как следствие, сокращение трафика.
Мы будем внимательно следить за эволюцией индикатора PageRank в следующем месяце
Источник: http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf

Декабрь 5-ое, 2007 | 12:03 дп
интересно , спасибо за перевод !
Декабрь 5-ое, 2007 | 12:08 пп
отличная статья
Декабрь 5-ое, 2007 | 1:12 пп
интересная статья, спасибо
Декабрь 5-ое, 2007 | 3:10 пп
Интересная статья. Можем обсудить возможность ее размещения на SEONEWS? Если удобнее, давайте пообщаемся по ICQ 406201835
Декабрь 5-ое, 2007 | 5:27 пп
Анастасия, размещайте со ссылкой на нас и на html4seo пожалуйста, с этим проблем никаких нет.
Декабрь 10-ое, 2007 | 1:08 пп
Статья дельнай, но че то слабо авторы взялись за ум … приближать линейной функцией хзависимость позиции от page rank это как то совусем тупо …
То есть если падает на 1 за 100 позиций и у меня 1000 позиция – хначит PR у меня отрицательный ? =)
Думаю надо бы подобрать более грамотную зависимость и кстати многим она была бы интересно =)
Декабрь 12-ое, 2007 | 10:58 пп
интересная статья, спасибоq8
Декабрь 13-ое, 2007 | 2:37 пп
Hello,
We are the HTML4SEO Team (http://www.html4seo.com). Thanks for your russian translation of our Pagerank & SERP study http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf .
Did you have a look at our complete software solution about SEO optimization of HTML code ?
If you want, we can give you a user account (with 10 free audits) to try it. We are looking for partners to sell our solution in Russia. Of course, there is a little work (translation, russian charset management, …) before we can start. About the partnership, you can have a little idea about what we are looking for here
http://www.html4seo.com/index.php?module=partner&action=SubscriptionRequest
If you are interested, we can have contact by Skype.
You can also try our free diaGnoZtiK seo soft http://www.gnoztik.com (with russian version of Google) which would interest your readers.
Best regards,
HTML4SEO Team
http://www.gnoztik.com
http://www.html4seo.com
Декабрь 13-ое, 2007 | 2:59 пп
Гы :) Буржуйские товарищи решили о случаю попиариться
Апрель 3-ое, 2008 | 9:50 дп
По мне так чисто технарьская статья, для рядового обывателя малопонятная.
Январь 2-ое, 2009 | 7:54 пп
Много леса для меня конечно щас , но все равно такую штуку как пр , надо знать.
Январь 12-ое, 2009 | 4:28 дп
вывод:
-да просто регистрировать в каталогах и более менее подкоректировать титлы и.т.д.
и будеш в середине
Февраль 9-ое, 2009 | 4:13 дп
отличная статья конечно немного заумно но все таки есть реальные алгоритмы , все равно приходишь к тому что самый лучший способ поднять PR это поставить ссылку с сайта c PR 10 и вам обеспечен PR 8-9 , секрет лишь в том что нужно знать сайт с PR 10!!! Удачи всем в оптимизации
Февраль 21-ое, 2009 | 10:54 пп
Да, спасибо за статью, выводы сделаны.
Почти всё понял. :))
Июль 7-ое, 2009 | 2:47 пп
Я вообще не понял о чем речь если честно =) Интересен только последний кусок текста, остальное – непонятные графы и расчеты =) Но так или иначе, спс за материал, друг грит чето понял из этого )
Март 24-ое, 2010 | 6:32 пп
Это всего лишь гипотеза..