Google кардинально поменял свое отношение к «динамическим» адресам

Официальная новость от Google.

Общение с вебмастерами в чате позволяет выявить распространенные мнения, которые могли соответствовать действительности в прошлом, но потеряли свою актуальность к сегодняшнему дню. Примером может послужить моя недавняя беседа с несколькими приятелями на тему оптимальной структуры URL. Один из них беспокоился по поводу использования динамических адресов, поскольку (как он сказал) «поисковым системам трудно иметь с ними дело». Другой утверждал, что обработка динамических URL уже давно не представляет для поисковиков никаких трудностей. Один из них также добавил, что он никогда толком не понимал суеты, поднятой вокруг  динамических  и статических  адресов.  В этот момент мы решили написать топик, целиком посвященный данной проблеме. Сперва, давайте проясним, о чем, собственно, идет речь.

Что такое статический URL?

Статический URL — это адрес, который не меняется и, как правило, не содержит в себе никаких параметров. Статический адрес может выглядеть, например, так: http://www.example.com/archive/january.htm. Вы можете включить поиск по статическим адресам в Google, набрав filetype:htm в поисковой строке. Обновление подобных страниц зачастую  отнимает довольно много времени, особенно если количество информации быстро растет, поскольку код каждой отдельной страницы приходится приходится писать и редактировать в индивидуальном порядке. Вот почему вебмастеры, имеющие дело с часто обновляемыми сайтами — например, интернет-магазинами, форумами, блогами или системами управления контентом — нередко используют динамические адреса.

Что такое динамические адреса?

Если контент сайта хранится в базе данных и выводится на дисплей по запросу, как правило, используются динамические адреса. Сам сайт в этом случае играет роль шаблона для контента, существующего независимо от своего визуального представления. Как правило динамические URL выглядят примерно так: http://code.google.com/p/google-checkout-php-sample-code/issues/detail?id=31. Признаком динамического адреса служат символы ? = &. Динамические адреса имеют тот недостаток, что нескольким различным URL может соответствовать один и тот же контент. Таким образом, пользователи могут ссылаться на один и тот же контент с помощью разных URL, используя отличные параметры запроса. Вот почему вебмастера зачастую пытаются настроить приведение динамических адресов к статическому виду.

Нужно ли маскировать динамические URL под статические?

Перечислим несколько ключевых моментов, о которых необходимо помнить в связи с динамическими адресами:

  1. Создать и поддерживать механизм, корректно преобразующий динамические адреса в статические, довольно трудно.
  2. Куда проще и надежней будет использовать динамические адреса и позволить нам самим решать проблему нахождения и игнорирования ненужных параметров.
  3. Если вы-таки намерены преобразовывать адреса, пожалуйста, удалите из них все необязательные параметры, но оставьте их динамическими. 
  4. Если вы намерены выдавать статические адреса вместо динамических, вам следует продублировать свой динамический контент статическим эквивалентом.

Какие адреса Google легче воспринимать — статические или динамические?

Мы имели дело с множеством вебмастеров, считавших, как и упомянутые выше приятели,что статические или внешне статические адреса являются преимуществом с точки зрения индексации и ранжирования их сайтов. Эта вера базируется на предположении, согласно которому поисковые системы испытывают трудности с краулингом и анализом адресов, содержащих в себе идентификаторы сессий или единиц контента.  Как бы то ни было, мы в Google сумели значительно продвинуться в обоих обозначенных направлениях. Да, статические адреса могут иметь небольшое преимущество в плане кликабельности, поскольку пользователю легче их читать. Тем не менее использование веб-сайтов на основе баз данных не влечет за собой сколько-нибудь значимых потерь в плане индексации и ранжирования. Таким образом,  использование нетронутых динамических адресов предпочтительнее попыток спрятать  параметры и заставить их выглядеть статично.

Миф: «Динамические URL не индексируются».
Факт:
Мы без проблем индексируем динамические адреса и интерпретируем различные параметры. У нас могут возникнуть проблемы с краулингом и ранжированием динамических URL в том случае, если вы приводите их к статическому виду и прячете при этом параметры, несущие ценную информацию для Google-бота. Отсюда следует рекомендация — не  преобразовывать динамические  URL в статические. Вообще лучше всего использовать статический контент со статическими адресами, однако если уж вы решили использовать динамический контент, вы должны предоставить нам возможность анализировать структуру ваших URL. Другими словами, не нужно нужно маскировать параметры, приводя их к статичному виду.

Миф: «Динамические адреса должны содержать в себе менее трех параметров».
Факт:
Ограничения по количеству параметров не существует, тем не менее общим правилом должно быть стремление к  коротким  URL (это относится к любым адресам, и статическим, и динамическим). Возможно, вам стоит удалить параметры, не важные Google-боту, и предоставить пользователям более симпатичные динамические URL. Если вы не до конца уверены в том, какие именно параметры подлежат удалению, мы советуем не удалять ничего — наша система сама отбросит все ненужное. Неграмотное преобразование существенно затрудняет задачу по выделению важных параметров, то есть мешает нам правильно анализировать URL, что в конечном итоге ведет к информационным потерям.

Далее осветим несколько наиболее вероятных вероятных вопросов.

Значит ли это, что мне стоит избегать преобразования динамических URL?Таковы наши рекомендации — до тех пор, пока речь не идет об удалении необязательных и потенциально проблемных параметров. Приведение  динамических адресов к статическому виду может помешать нам корректно интерпретировать вашу информацию во всех возможных случаях. Если вы намерены предоставлять пользователям статический эквивалент вашего сайта, вам следует задуматься о преобразовании не только адресов, но и структуры самого контента — таким образом, чтобы информация на выходе и в самом деле выглядела статично. Например, можно сгенерировать по файлу для каждого из возможных адресов и сделать эти файлы доступными где-либо на сайте, чтобы пользователи и поисковики обращались именно к этим файлам. Как бы то ни было, преобразование адресов без создания статичной копии контента рискует принести больше вреда, нежели пользы. Лучше показывайте нам динамические адреса — мы сами сможем выявить в них все лишнее.

Можете привести пример?

Если стандартный формат ваших динамических адресов выглядит примерно так:  foo?key1=value&key2=value2 мы рекомендуем оставить его неизменным. Google сам определит, какие параметры можно из него удалить. Вы можете и сами можете удалить из URL необязательные для пользователей параметры, однако будьте предельно осторожны, чтобы случайно не удались что-нибудь важное. Вот еще один пример динамического адреса с несколькими параметрами:

www.example.com/article/bin/answer.foo?language=en&answer=3&sid=98971298178906&query=URL

  • language=en — указывает на язык статьи
  • answer=3 — статья имеет порядковый номер 3
  • sid=8971298178906 — идентификатор сессии равен 8971298178906
  • query=URL — статья была найдена по запросу следущего типа: [URL]

Далеко не все параметры данного запроса несут в себе полезную информацию, поэтому приведение URL к виду www.example.com/article/bin/answer.foo?language=en&answer=3 вероятно, не создаст никаких проблем — из адреса были удалены только необязательные параметры.

Далее следует несколько адресов, выглядящих как статические, но вместе с тем способных затруднить краулинг гораздо сильнее, нежели стандартные динамические адреса:

Преобразование динамического адреса в нечто подобное может привести к тому, что краулеру придется по несколько раз индексировать один и тот же контент, доступный по разным адресам — с различными идентификаторами сессий и типами запроса.  Подобный формат адресов мешает  Google понять, что URL и  98971298178906 не имеют прямого отношения к контенту, лежащему по данному адресу. Далее — пример правильного преобразования, при котором все необязательные параметры были удалены:

Хотя Google обрабатывает такие адреса вполне корректно, и все-таки мы хотим вас предостеречь от использования подобных преобразований, поскольку соответствующий механизм труден в поддержке и нуждается в обновлении всякий раз, когда к изначальному динамическому адресу добавляется новый параметр. Если обновление не произойдет, на выходе опять получится статически выглядящий адрес с важным параметром, спрятанным от поисковой системы. Поэтому чаще всего лучшим решением будет использовать неизменные динамические адреса. Если же вы решили удалить из них необязательные параметры, помните о том, что в конечном итоге они должны остаться динамическими, как в уже приведенном примере:

Мы надеемся, что статья окажется вам полезна, и что в конечном итоге она поможет развеять разнообразные домыслы, связанные с проблемой динамических URL.  Если у вас остались какие-либо вопросы, пожалуйста, присоединяйтесь к нашей дискуссионной группе.
Источник: http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html

17 ответов на статью “Google кардинально поменял свое отношение к «динамическим» адресам”

  1. Комментарий от devaka:

    Да, есть такое.. несмотря на то, что гугл указывает положительные стороны динамических урлов, в комментах у них на блоге для вебмастеров мастера недовольны постом и приводят множество аргументов для использования всеже статических урлов.

  2. Комментарий от Artem:

    Кстати хотел давно пост на эту тему написать. :) Как и яша, так и гугл нормально индексируют динамические страницы. Уже много раз убеждался

  3. Комментарий от Игорь:

    Я считаю нет повода для беспокойства, URL что статические, что динамические индексируются одинаково, статические просто удобнее, вот и всё.

  4. Комментарий от Настасия Иванова:

    Спасибо, много нового узнала! Но насколько я понимаю паники для нас нет, т.к. индексация всеравно происходить будет….

  5. Комментарий от devaka:

    информация с официального блога гугл для вебмастеров:
    http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html

  6. Комментарий от Roman Kriman:

    Если посмотреть на все со стороны програмеров гугла, то:
    Статическая страница (будь то переобразованная или нет) гораздо вероятнее не изменится с течением времени.
    А динамическая может измениться и в этом случае гуглу придется заходить на нее множество раз дабы убедиться, что
    эта страница не изменилась.
    Думаю, что в этом все дело.
    Если на страницу ссылаются множество различных сайтов, то гугл ее проиндексует охотно,ибо люди – это самый верный показатель для машины краулера.
    Если уж люди поставили линки в блогах, форумах и т.д. , значит эта страница не измениться, или с большей вероятностью не будет менятся.

    Статические страницы (на мой взгляд) проходят при индексации другие алгоритмы и сл-но показатель «изменчивости контента» у них другой.

    Есть еще одна особенность краулера гугла, он проверяет несуществующие адреса, на результат http 404.
    Вот пример из вашей статьи:
    http://www.example.com/article/bin/answer.foo/en/3/98971298178906/URL
    Если я (или краулер гугла) изменит (допустим) цифру 3 на 23
    http://www.example.com/article/bin/answer.foo/en/23/98971298178906/URL

    То скрипт, как правило выдаст програмную ошибку (вместо ошибки 404)

    Не каждый вебмастер дописывает это суловие, хотя, оно (на мой взгляд) очень важно.

  7. Комментарий от Sergio SEO:

    Рамблер до сих пор в FAQ держит запись о том, что динамические аддреса с 3-мя переменными не обрабатываются! О чем тут можно говорить? А статику сделать ооооочень просто – вернее, псевдостатику. Создается .htaccess и Mod Rewrite’ом делается все необходимое.

  8. Комментарий от Pit:

    Статистические-намые выгодные Урлики, поскольку они неизмены, в отличии от динамических.Хотя индексируется она действительно лучше.

  9. Комментарий от Snickers11:

    Спора нет что Гугол индесирет сайты лучше всех,но к сожелению он также замечательно индексирует гавносайты и сайты мошейников,что яндекс например такого не зделает…

  10. Комментарий от Fisher:

    Ни разу не замечал дискриминации статических урлов. В WordPress, если не включать ЧПУ, все ссылки вида ?p=49. Тем не менее, ни разу не было дискомфорта, хотя и предпочитаю ЧПУ с шаблоном /%postname%/

  11. Комментарий от Олег:

    Я так понимаю все таки в стране больше динамических адресов?

  12. Комментарий от organic:

    @Snickers11 Ну дык неспособность Яндекса адекватно индексировать Сеть не есть признак того, что он интеллектуально исключает их индекса фишинговый контент

  13. Комментарий от Оксана:

    На мой взгляд статические страницы проходят при индексации другие алгоритмы и сл-но показатель “изменчивости контента” у них другой
    Впринципи для посетителей никакой проблемы нет.

  14. Комментарий от Я линкомаулия:

    Статичная адресация намного удобнее, это уже доказано всеми гуру юзабилити, например в том же самом Вордпресс,
    страница about легде запоминачется чем page_id=2.
    Или но форуцмах IPB index.php?showtopic=34324 запоминается труднее чем, topic34324.html. Или вобще можно юзать транслитерацию. Например google_pomenyal_otnoshenie_k_dinamicheskim_urlam.html

  15. Комментарий от Pulse:

    Я – за статические УРЛы, поскольку их удобнее читать и их можно использовать для навигации по сайту, конечно при грамотной реализации. Против динамических УРЛов ничего не имею до тех пор, пока в них не таскается идентификатор сессии (выключается в php.ini)

  16. Комментарий от Ярик:

    Спасибо за статью! Давно волновал вопрос про индексацию динамических и статических страниц.. тоесть как я понял, гуглу не особо важно это.

  17. Комментарий от Aleks:

    Хорошая и информативная статья. Подчеркнул много полезной информации. Могу только добавить (из личного опыта), что динамические адреса чуть дольше индексируются ботами поисковых систем.

Оставить свой комментарий


Enhanced comment spam protection by PuzzCAPTCHA