PageRаnk и позиция в выдаче: немного статистики

Представляем вашему вниманию анонсированный перевод аналитического исследования поведения Google Toolbar Pagerank.

В течение нескольких последних месяцев команда HTML4SEO провела тысячи обзоров выдачи Google. В ходе каждого обзора мы проверяли PageRank, количество входящих ссылок а также HTML-контент страниц, входящих в первую сотню списка выдачи Google. Мы публикуем небольшое статистическое исследование, основанное на полученных данных, в сопровождении некоторых выводов.

Этот текст посвящен только параметру PageRank. В скором времени мы планируем опубликовать два других исследования, в которых будет рассмотрено значение входящих ссылок и свойств HTML-контента — двух других важнейших факторов SEO.

Эволюция PageRank в выдаче Google в течение последних 6 месяцев





Корреляция между ранжированием и параметром PageRank

Наиболее распространенным методом расчета корреляции ρXY между величинами X и Y является коэффициент корреляции Браве-Пирсона, нередко называемый просто коэффициентом корреляции.

Коэффициент корреляции ρXY может варьироваться в пределах от +1 до -1. Если ρXY = 1 корреляция считается полностью положительной, если -1 — полностью отрицательной. В обоих случаях, зная значение X, мы можем точно определить значение Y и наоборот. На графике этим коэффициентам будут соответствовать точки (X, Y), выстроенные по прямой линии, при этом график может возрастать (положительная корреляция) или убывать (отрицательная корреляция).

Если ρXY = 0, то между переменными X и Y нет линейной зависимости, при этом они могут быть полностью независимы друг от друга, или же между ними может существовать некая сложная, нелинейная зависимость.

В нашем случае величинам X и Y соответствует конечное ранжирование (позиция в выдаче Google) и коэффициент PageRank (по тулбару). Ниже приведены данные, собранные в ходе 1000 первых обзоров (100 лучших позиций в выдаче Google по запросам с количеством результатов больше 100), которые делались каждый месяц в период с мая по октябрь 2007 г.

2007 коэффициент корреляции
Май -0,85
Июнь -0,88
Июль -0,90
Август -0,88
Сентябрь -0,86
Октябрь -0,88
Среднее арифметическое -0,88
Стандартное отклонение 0,02

Комментарии:

1-е наблюдение. Коэффициент корреляции между ранжированием и PageRank близок к единице (в абсолютном выражении). Ранжирование и PageRank сильно коррелируют друг с другом. Высокий PageRank несомненно улучшает ранжирование.

2-е наблюдение. Коэффициент корреляции между ранжированием и PageRank демонстрирует высокую стабильность, имея среднее значение в 0,88 при стандартном отклонении в 2%. Вес параметра PageRank в рамках алгоритма ранжирования Google скорее всего не менялся. Ранжирование зависит от PageRank.

Утверждения типа «PageRank мертв!» или «PageRank имеет отношение только к маркетингу» не соответствуют действительности. PageRank не умер, его значение не уменьшилось до чисто маркетингового индикатора — он остается весьма существенной частью алгоритма ранжирования Google.

Линейная интерполяция ранжирования и PageRank

Теперь обратимся к линейной регрессии:

(Речь идет об анализе совокупности линейных функций типа f(x) = Ax + B, при этом коэффициент A, равный тангенсу угла наклона линии соответствующего графика, именуется в оригинальном тексте параметром «A slope», а коэффициент В, указывающий на ординату точки пересечения графика с осью Y – «B Y-intercept», смысл этого коэффициента – средний (по разным запросам) PageRank страницы занимающей первую позицию в выдаче; мы оставляем эти наименования без изменений, заключая их в кавычки для удобства чтения — Прим. пер.)

  Линейная регрессия A slope В Y-intercept
Май y = -0,01x + 3,42 -0,01 3,42
Июнь y = -0,01x + 3,39 -0,01 3,39
Июль y = -0,01x + 3,31 -0,01 3,31
Август y = -0,01x + 3,20 -0,01 3,20
Сентябрь y = -0,01x + 3,15 -0,01 3,15
Октябрь y = -0,01x + 3,13 -0,01 3,13

Комментарии:

1-е наблюдение. Коэффициент «A Slope» (http://en.wikipedia.org/wiki/Linear_function) остается постоянным и равняется 1/100, что соответствует падению PageRank на 1 единицу при ухудшении ранжирования на 100 позиций. В течение последних нескольких месяцев эта картина оставалась неизменной.

2-е наблюдение. Коэффициент «B Y-intercept» (линейная интерполяция PageRank, соответствующего первому месту в выдаче) уменьшается. Другими словами, требования по параметру PageRank к сайтам, попадающим в топ выдачи Google, с каждым месяцем становятся все менее строгими.

Изменения Y-intercept линейной регрессии ранжирования и PageRank

Распределение значений Y-intercept линейной регрессии по временной шкале, охватывающей период с мая по октябрь 2007 г., демонстрирует корреляцию в -0,98, что является признаком очень тесной линейной зависимости между двумя переменными. Соответствующая линейная регрессия выражается формулой y = -0,07x + 3,49. Из нее можно без труда вывести, что требования по PageRank к сайтам, попадающим в топ выдачи, уменьшаются на 1 единицу PageRank каждые 14 месяцев.

К представленным результатам следует относиться с известной долей сомнения. Они были получены статистическим методом, следовательно их можно рассматривать лишь как индикатор самых общих тенденций — не более того. И все же они представляют немалый интерес.

Чем может быть обусловлено падение PageRank в выдаче Google?

По мере роста всемирной сети количество релевантных документов с низким PageRank увеличивается. Среди огромного корпуса доступных страниц всегда найдется значительное число документов, выделяющихся своим качеством, но вместе с тем имеющих низкий PageRank и малое количество входящих ссылок. Это обстоятельство по-новому ставит вопрос о семантической релевантности возвращаемых Google страниц.

Возможно, несколько месяцев назад Google попросту начал отслеживать сайты на предмет подозрительных (black hat) входящих ссылок. Ссылок, которые рассматриваются как благонадежные, становится все меньше и меньше и прежние лидеры выдачи сменились прошлыми аутсайдерами с меньшим количеством обратных ссылок (и соответственно PageRank) зато их более высоким «качеством».
Такие изменения значения Pagerank сайтов из выдачи Google могли стать возможными потому что алгоритм вычисления Pagerank глобальный и учитывает все ссылки, а не только ссылки между тематически близкими сайтами.

Или: несколько месяцев назад началась масштабная рекалибровка PageRank (кое-кто высказывал и такое предположение). Недавний апдейт индикатора, заметный невооруженным глазом, подтверждает эту гипотезу, поскольку процесс рекалибровки должен включать в себя глобальное падение PageRank до квази-начального уровня.

Вероятно, существует множество других гипотез…

PageRank в ноябре 2007 г.

Похоже, что в ходе этого месяца произошли более радикальные изменения, нежели в течение нескольких предыдущих месяцев. У кого-то PageRank вырос сразу на 3 пункта, у кого-то — упал на эту же величину. При этом изменения PageRank носят нелинейный характер. Поскольку между конечным ранжированием и значением PageRank существует очень сильная корреляция, те, у кого PageRank обвалился, имеют вполне реальную почву для беспокойства. За уменьшением PageRank непременно последует потеря позиций в выдаче Google и, как следствие, сокращение трафика.

Мы будем внимательно следить за эволюцией индикатора PageRank в следующем месяце

Источник: http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf

16 ответов на статью “PageRаnk и позиция в выдаче: немного статистики”

  1. Комментарий от oggin:

    интересно , спасибо за перевод !

  2. Комментарий от Alexei A. Korolev:

    отличная статья

  3. Комментарий от Андрей Арсеньев:

    интересная статья, спасибо

  4. Комментарий от Анастасия:

    Интересная статья. Можем обсудить возможность ее размещения на SEONEWS? Если удобнее, давайте пообщаемся по ICQ 406201835

  5. Комментарий от info:

    Анастасия, размещайте со ссылкой на нас и на html4seo пожалуйста, с этим проблем никаких нет.

  6. Комментарий от andrew13:

    Статья дельнай, но че то слабо авторы взялись за ум … приближать линейной функцией хзависимость позиции от page rank это как то совусем тупо …
    То есть если падает на 1 за 100 позиций и у меня 1000 позиция – хначит PR у меня отрицательный ? =)
    Думаю надо бы подобрать более грамотную зависимость и кстати многим она была бы интересно =)

  7. Комментарий от Дмитрий:

    интересная статья, спасибоq8

  8. Комментарий от HTML4SEO:

    Hello,

    We are the HTML4SEO Team (http://www.html4seo.com). Thanks for your russian translation of our Pagerank & SERP study http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf .

    Did you have a look at our complete software solution about SEO optimization of HTML code ?
    If you want, we can give you a user account (with 10 free audits) to try it. We are looking for partners to sell our solution in Russia. Of course, there is a little work (translation, russian charset management, …) before we can start. About the partnership, you can have a little idea about what we are looking for here
    http://www.html4seo.com/index.php?module=partner&action=SubscriptionRequest

    If you are interested, we can have contact by Skype.

    You can also try our free diaGnoZtiK seo soft http://www.gnoztik.com (with russian version of Google) which would interest your readers.

    Best regards,
    HTML4SEO Team
    http://www.gnoztik.com
    http://www.html4seo.com

  9. Комментарий от odp:

    Гы :) Буржуйские товарищи решили о случаю попиариться

  10. Комментарий от сергей:

    По мне так чисто технарьская статья, для рядового обывателя малопонятная.

  11. Комментарий от Секрет:

    Много леса для меня конечно щас , но все равно такую штуку как пр , надо знать.

  12. Комментарий от adidas:

    вывод:
    -да просто регистрировать в каталогах и более менее подкоректировать титлы и.т.д.
    и будеш в середине

  13. Комментарий от Alex:

    отличная статья конечно немного заумно но все таки есть реальные алгоритмы , все равно приходишь к тому что самый лучший способ поднять PR это поставить ссылку с сайта c PR 10 и вам обеспечен PR 8-9 , секрет лишь в том что нужно знать сайт с PR 10!!! Удачи всем в оптимизации

  14. Комментарий от Михаил (antonovmik):

    Да, спасибо за статью, выводы сделаны.
    Почти всё понял. :))

  15. Комментарий от Тольятти:

    Я вообще не понял о чем речь если честно =) Интересен только последний кусок текста, остальное – непонятные графы и расчеты =) Но так или иначе, спс за материал, друг грит чето понял из этого )

  16. Комментарий от Master:

    Это всего лишь гипотеза..

Оставить свой комментарий


Enhanced comment spam protection by PuzzCAPTCHA