Представляем вашему вниманию анонсированный перевод аналитического исследования поведения Google Toolbar Pagerank.
В течение нескольких последних месяцев команда HTML4SEO провела тысячи обзоров выдачи Google. В ходе каждого обзора мы проверяли PageRank, количество входящих ссылок а также HTML-контент страниц, входящих в первую сотню списка выдачи Google. Мы публикуем небольшое статистическое исследование, основанное на полученных данных, в сопровождении некоторых выводов.
Этот текст посвящен только параметру PageRank. В скором времени мы планируем опубликовать два других исследования, в которых будет рассмотрено значение входящих ссылок и свойств HTML-контента — двух других важнейших факторов SEO.
Эволюция PageRank в выдаче Google в течение последних 6 месяцев





Корреляция между ранжированием и параметром PageRank
Наиболее распространенным методом расчета корреляции ρXY между величинами X и Y является коэффициент корреляции Браве-Пирсона, нередко называемый просто коэффициентом корреляции.
Коэффициент корреляции ρXY может варьироваться в пределах от +1 до -1. Если ρXY = 1 корреляция считается полностью положительной, если -1 — полностью отрицательной. В обоих случаях, зная значение X, мы можем точно определить значение Y и наоборот. На графике этим коэффициентам будут соответствовать точки (X, Y), выстроенные по прямой линии, при этом график может возрастать (положительная корреляция) или убывать (отрицательная корреляция).
Если ρXY = 0, то между переменными X и Y нет линейной зависимости, при этом они могут быть полностью независимы друг от друга, или же между ними может существовать некая сложная, нелинейная зависимость.
В нашем случае величинам X и Y соответствует конечное ранжирование (позиция в выдаче Google) и коэффициент PageRank (по тулбару). Ниже приведены данные, собранные в ходе 1000 первых обзоров (100 лучших позиций в выдаче Google по запросам с количеством результатов больше 100), которые делались каждый месяц в период с мая по октябрь 2007 г.
| 2007 |
коэффициент корреляции |
| Май |
-0,85 |
| Июнь |
-0,88 |
| Июль |
-0,90 |
| Август |
-0,88 |
| Сентябрь |
-0,86 |
| Октябрь |
-0,88 |
| Среднее арифметическое |
-0,88 |
| Стандартное отклонение |
0,02 |
Комментарии:
1-е наблюдение. Коэффициент корреляции между ранжированием и PageRank близок к единице (в абсолютном выражении). Ранжирование и PageRank сильно коррелируют друг с другом. Высокий PageRank несомненно улучшает ранжирование.
2-е наблюдение. Коэффициент корреляции между ранжированием и PageRank демонстрирует высокую стабильность, имея среднее значение в 0,88 при стандартном отклонении в 2%. Вес параметра PageRank в рамках алгоритма ранжирования Google скорее всего не менялся. Ранжирование зависит от PageRank.
Утверждения типа «PageRank мертв!» или «PageRank имеет отношение только к маркетингу» не соответствуют действительности. PageRank не умер, его значение не уменьшилось до чисто маркетингового индикатора — он остается весьма существенной частью алгоритма ранжирования Google.
Линейная интерполяция ранжирования и PageRank
Теперь обратимся к линейной регрессии:
(Речь идет об анализе совокупности линейных функций типа f(x) = Ax + B, при этом коэффициент A, равный тангенсу угла наклона линии соответствующего графика, именуется в оригинальном тексте параметром «A slope», а коэффициент В, указывающий на ординату точки пересечения графика с осью Y – «B Y-intercept», смысл этого коэффициента – средний (по разным запросам) PageRank страницы занимающей первую позицию в выдаче; мы оставляем эти наименования без изменений, заключая их в кавычки для удобства чтения — Прим. пер.)
| |
Линейная регрессия |
A slope |
В Y-intercept |
| Май |
y = -0,01x + 3,42 |
-0,01 |
3,42 |
| Июнь |
y = -0,01x + 3,39 |
-0,01 |
3,39 |
| Июль |
y = -0,01x + 3,31 |
-0,01 |
3,31 |
| Август |
y = -0,01x + 3,20 |
-0,01 |
3,20 |
| Сентябрь |
y = -0,01x + 3,15 |
-0,01 |
3,15 |
| Октябрь |
y = -0,01x + 3,13 |
-0,01 |
3,13 |
Комментарии:
1-е наблюдение. Коэффициент «A Slope» (http://en.wikipedia.org/wiki/Linear_function) остается постоянным и равняется 1/100, что соответствует падению PageRank на 1 единицу при ухудшении ранжирования на 100 позиций. В течение последних нескольких месяцев эта картина оставалась неизменной.
2-е наблюдение. Коэффициент «B Y-intercept» (линейная интерполяция PageRank, соответствующего первому месту в выдаче) уменьшается. Другими словами, требования по параметру PageRank к сайтам, попадающим в топ выдачи Google, с каждым месяцем становятся все менее строгими.
Изменения Y-intercept линейной регрессии ранжирования и PageRank
Распределение значений Y-intercept линейной регрессии по временной шкале, охватывающей период с мая по октябрь 2007 г., демонстрирует корреляцию в -0,98, что является признаком очень тесной линейной зависимости между двумя переменными. Соответствующая линейная регрессия выражается формулой y = -0,07x + 3,49. Из нее можно без труда вывести, что требования по PageRank к сайтам, попадающим в топ выдачи, уменьшаются на 1 единицу PageRank каждые 14 месяцев.
К представленным результатам следует относиться с известной долей сомнения. Они были получены статистическим методом, следовательно их можно рассматривать лишь как индикатор самых общих тенденций — не более того. И все же они представляют немалый интерес.
Чем может быть обусловлено падение PageRank в выдаче Google?
По мере роста всемирной сети количество релевантных документов с низким PageRank увеличивается. Среди огромного корпуса доступных страниц всегда найдется значительное число документов, выделяющихся своим качеством, но вместе с тем имеющих низкий PageRank и малое количество входящих ссылок. Это обстоятельство по-новому ставит вопрос о семантической релевантности возвращаемых Google страниц.
Возможно, несколько месяцев назад Google попросту начал отслеживать сайты на предмет подозрительных (black hat) входящих ссылок. Ссылок, которые рассматриваются как благонадежные, становится все меньше и меньше и прежние лидеры выдачи сменились прошлыми аутсайдерами с меньшим количеством обратных ссылок (и соответственно PageRank) зато их более высоким «качеством».
Такие изменения значения Pagerank сайтов из выдачи Google могли стать возможными потому что алгоритм вычисления Pagerank глобальный и учитывает все ссылки, а не только ссылки между тематически близкими сайтами.
Или: несколько месяцев назад началась масштабная рекалибровка PageRank (кое-кто высказывал и такое предположение). Недавний апдейт индикатора, заметный невооруженным глазом, подтверждает эту гипотезу, поскольку процесс рекалибровки должен включать в себя глобальное падение PageRank до квази-начального уровня.
Вероятно, существует множество других гипотез…
PageRank в ноябре 2007 г.
Похоже, что в ходе этого месяца произошли более радикальные изменения, нежели в течение нескольких предыдущих месяцев. У кого-то PageRank вырос сразу на 3 пункта, у кого-то — упал на эту же величину. При этом изменения PageRank носят нелинейный характер. Поскольку между конечным ранжированием и значением PageRank существует очень сильная корреляция, те, у кого PageRank обвалился, имеют вполне реальную почву для беспокойства. За уменьшением PageRank непременно последует потеря позиций в выдаче Google и, как следствие, сокращение трафика.
Мы будем внимательно следить за эволюцией индикатора PageRank в следующем месяце
Источник: http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf