Архив за Декабрь, 2007

С наступающим!

Было бы здорово закончить месяц парочкой ударных публикаций, да вот беда ― в индустрии наблюдается явное затишье, связанное с уже состоявшимся неправославным рождеством. Поэтому редакция SeoWeblog просто поздравляет всех читателей с наступающим Новым годом и начинает готовиться к новогодним каникулам. Всем всего самого лучшего. Встретимся после праздников!

Настала эра «умного» спама?

Далеко не секрет, что одним и до недавнего времени основным методом black hat SEO был линкспам. Суть этого метода вкратце такова: оставить свою ссылку где только можно. На качество ссылок, куда они ставятся и тому подобное занимающиеся такими вещами особого внимания не обращали. Получалось приличное число ссылок на сайт, но вот только каких? Мусорных. И сейчас не составляет особого труда сделать на свой сайт много тысяч ссылок, да вот вопрос – а нужно ли это? Если мы посмотрим выдачу по высокочастотным запросам в Google (phentermine, online casino, viagra, levitra, slots, car insurance, …) и мы увидим удивительную вещь: такие спамеры есть, но их очень мало! Сравним с ситуацией двухлетней давности. Ясно – тема умерла.

Читать статью целиком »

Как Yahoo (ну или Facebook) может реально завалить Google


«Давид с головой Голиафа» гравюра Г. Доре.

Лукас Инг

«Любая история о том, как выскочки вроде Facebook могут победить Google, будет обязательно выслушана — хотя бы для того, чтобы поспорить на этот счет». — Роберт Скоубл (Robert Scoble)

Чтобы проверить теорию Роберта и обеспечить его «Убийц Google» запоздалой поддержкой, мы начнем сегодняшнюю вечеринку с рассказа о маленьком корейском сайте, которому заявленное выше вполне удалось.

За пределами Кореи мало кто слышал о Naver — корейском веб-портале, запущенном в июне 1999 г. Несмотря на присутствие в стране Google, Yahoo и множества конкурирующих национальных поисковиков, Naver является бесспорным лидером корейского поиска, имея в своем активе более миллиарда просмотров ежедневно вкупе с 77% поискового рынка страны.

Читать статью целиком »

Google блокирует объявления, предлагающие купить PageRank

На страницах своего блога Мэтт Каттс обмолвился о том, что команды Google Spam и Google AdWords объединили свои усилия на ниве борьбы с платными ссылками вообще и теми, кто рекламирует их через AdWords, в частности. Вот что написал главный спец Google по спаму: «Недавно я чатился с ребятами из AdWords, отвечающими за корректность рекламы, и в итоге ребята блокировали подачу объявлений по запросам типа «pagerank 8», ранее возвращавшим многочисленные объявления. Думаю, в ближайшее время мы отменим рекламу и для множества других запросов, соответствующих категории «куплю PageRank».

Заметим: сказанное отнюдь не значит, что Google банит всех издателей рекламы, продающих ссылки. Банятся только те из них, кто в открытую предлагает подтянуть PageRank c помощью платной ссылки и таким образом повлиять на ранжирование.

http://www.searchenginejournal.com/google-banning-ads-for-pagerank-selling-schemes/6042/

PageRаnk и позиция в выдаче: немного статистики

Представляем вашему вниманию анонсированный перевод аналитического исследования поведения Google Toolbar Pagerank.

В течение нескольких последних месяцев команда HTML4SEO провела тысячи обзоров выдачи Google. В ходе каждого обзора мы проверяли PageRank, количество входящих ссылок а также HTML-контент страниц, входящих в первую сотню списка выдачи Google. Мы публикуем небольшое статистическое исследование, основанное на полученных данных, в сопровождении некоторых выводов.

Этот текст посвящен только параметру PageRank. В скором времени мы планируем опубликовать два других исследования, в которых будет рассмотрено значение входящих ссылок и свойств HTML-контента — двух других важнейших факторов SEO.

Эволюция PageRank в выдаче Google в течение последних 6 месяцев





Корреляция между ранжированием и параметром PageRank

Наиболее распространенным методом расчета корреляции ρXY между величинами X и Y является коэффициент корреляции Браве-Пирсона, нередко называемый просто коэффициентом корреляции.

Коэффициент корреляции ρXY может варьироваться в пределах от +1 до -1. Если ρXY = 1 корреляция считается полностью положительной, если -1 — полностью отрицательной. В обоих случаях, зная значение X, мы можем точно определить значение Y и наоборот. На графике этим коэффициентам будут соответствовать точки (X, Y), выстроенные по прямой линии, при этом график может возрастать (положительная корреляция) или убывать (отрицательная корреляция).

Если ρXY = 0, то между переменными X и Y нет линейной зависимости, при этом они могут быть полностью независимы друг от друга, или же между ними может существовать некая сложная, нелинейная зависимость.

В нашем случае величинам X и Y соответствует конечное ранжирование (позиция в выдаче Google) и коэффициент PageRank (по тулбару). Ниже приведены данные, собранные в ходе 1000 первых обзоров (100 лучших позиций в выдаче Google по запросам с количеством результатов больше 100), которые делались каждый месяц в период с мая по октябрь 2007 г.

2007 коэффициент корреляции
Май -0,85
Июнь -0,88
Июль -0,90
Август -0,88
Сентябрь -0,86
Октябрь -0,88
Среднее арифметическое -0,88
Стандартное отклонение 0,02

Комментарии:

1-е наблюдение. Коэффициент корреляции между ранжированием и PageRank близок к единице (в абсолютном выражении). Ранжирование и PageRank сильно коррелируют друг с другом. Высокий PageRank несомненно улучшает ранжирование.

2-е наблюдение. Коэффициент корреляции между ранжированием и PageRank демонстрирует высокую стабильность, имея среднее значение в 0,88 при стандартном отклонении в 2%. Вес параметра PageRank в рамках алгоритма ранжирования Google скорее всего не менялся. Ранжирование зависит от PageRank.

Утверждения типа «PageRank мертв!» или «PageRank имеет отношение только к маркетингу» не соответствуют действительности. PageRank не умер, его значение не уменьшилось до чисто маркетингового индикатора — он остается весьма существенной частью алгоритма ранжирования Google.

Линейная интерполяция ранжирования и PageRank

Теперь обратимся к линейной регрессии:

(Речь идет об анализе совокупности линейных функций типа f(x) = Ax + B, при этом коэффициент A, равный тангенсу угла наклона линии соответствующего графика, именуется в оригинальном тексте параметром «A slope», а коэффициент В, указывающий на ординату точки пересечения графика с осью Y – «B Y-intercept», смысл этого коэффициента – средний (по разным запросам) PageRank страницы занимающей первую позицию в выдаче; мы оставляем эти наименования без изменений, заключая их в кавычки для удобства чтения — Прим. пер.)

  Линейная регрессия A slope В Y-intercept
Май y = -0,01x + 3,42 -0,01 3,42
Июнь y = -0,01x + 3,39 -0,01 3,39
Июль y = -0,01x + 3,31 -0,01 3,31
Август y = -0,01x + 3,20 -0,01 3,20
Сентябрь y = -0,01x + 3,15 -0,01 3,15
Октябрь y = -0,01x + 3,13 -0,01 3,13

Комментарии:

1-е наблюдение. Коэффициент «A Slope» (http://en.wikipedia.org/wiki/Linear_function) остается постоянным и равняется 1/100, что соответствует падению PageRank на 1 единицу при ухудшении ранжирования на 100 позиций. В течение последних нескольких месяцев эта картина оставалась неизменной.

2-е наблюдение. Коэффициент «B Y-intercept» (линейная интерполяция PageRank, соответствующего первому месту в выдаче) уменьшается. Другими словами, требования по параметру PageRank к сайтам, попадающим в топ выдачи Google, с каждым месяцем становятся все менее строгими.

Изменения Y-intercept линейной регрессии ранжирования и PageRank

Распределение значений Y-intercept линейной регрессии по временной шкале, охватывающей период с мая по октябрь 2007 г., демонстрирует корреляцию в -0,98, что является признаком очень тесной линейной зависимости между двумя переменными. Соответствующая линейная регрессия выражается формулой y = -0,07x + 3,49. Из нее можно без труда вывести, что требования по PageRank к сайтам, попадающим в топ выдачи, уменьшаются на 1 единицу PageRank каждые 14 месяцев.

К представленным результатам следует относиться с известной долей сомнения. Они были получены статистическим методом, следовательно их можно рассматривать лишь как индикатор самых общих тенденций — не более того. И все же они представляют немалый интерес.

Чем может быть обусловлено падение PageRank в выдаче Google?

По мере роста всемирной сети количество релевантных документов с низким PageRank увеличивается. Среди огромного корпуса доступных страниц всегда найдется значительное число документов, выделяющихся своим качеством, но вместе с тем имеющих низкий PageRank и малое количество входящих ссылок. Это обстоятельство по-новому ставит вопрос о семантической релевантности возвращаемых Google страниц.

Возможно, несколько месяцев назад Google попросту начал отслеживать сайты на предмет подозрительных (black hat) входящих ссылок. Ссылок, которые рассматриваются как благонадежные, становится все меньше и меньше и прежние лидеры выдачи сменились прошлыми аутсайдерами с меньшим количеством обратных ссылок (и соответственно PageRank) зато их более высоким «качеством».
Такие изменения значения Pagerank сайтов из выдачи Google могли стать возможными потому что алгоритм вычисления Pagerank глобальный и учитывает все ссылки, а не только ссылки между тематически близкими сайтами.

Или: несколько месяцев назад началась масштабная рекалибровка PageRank (кое-кто высказывал и такое предположение). Недавний апдейт индикатора, заметный невооруженным глазом, подтверждает эту гипотезу, поскольку процесс рекалибровки должен включать в себя глобальное падение PageRank до квази-начального уровня.

Вероятно, существует множество других гипотез…

PageRank в ноябре 2007 г.

Похоже, что в ходе этого месяца произошли более радикальные изменения, нежели в течение нескольких предыдущих месяцев. У кого-то PageRank вырос сразу на 3 пункта, у кого-то — упал на эту же величину. При этом изменения PageRank носят нелинейный характер. Поскольку между конечным ранжированием и значением PageRank существует очень сильная корреляция, те, у кого PageRank обвалился, имеют вполне реальную почву для беспокойства. За уменьшением PageRank непременно последует потеря позиций в выдаче Google и, как следствие, сокращение трафика.

Мы будем внимательно следить за эволюцией индикатора PageRank в следующем месяце

Источник: http://www.html4seo.com/seo-pdf/google-pagerank-serp-statistics.pdf