Url и rel canonical не совпадают. Rel="canonical" - полное руководство по атрибуту канонических адресов

Канонический URL (canonical) позволяет указать поисковой системе, какая ссылка является предпочтительной для индексации. Настройкой canonical необходимо заниматься, если у вас на сайте имеются страницы с одинаковым содержанием. Ввиду особенностей CMS сайта могут автоматически создаваться страницы с одним и тем же контентом по разным адресам URL (более подробно читайте ниже). Появление подобных страниц возможно вследствие таких причин:

  1. Если вы написали одно и то же сообщение в разных темах блога, то есть вероятность автоматического создания еще одной страницы сайта.
  2. Например, у вас есть несколько доменов: http://article.example.com и http://blogs.example.com. И вы планируете размещать информацию сразу на обоих ресурсах. В таком случае размещаемый контент будет дублированным.
  3. Если была обновлена структура вашего сайта, после чего URL страниц сайта могли быть изменены.

Чтобы не допустить дублирования страниц сайта в поисковой выдаче, необходимо настроить канонические URL, после чего поисковик сможет определить, какую страницу нужно индексировать. Рассмотрим причины, из-за которых важно заниматься настройкой canonical:

  1. Если на разных страницах вашего сайта публикуется частично или полностью идентичная информация, то следует указать, какую страницу следует считать основной.
  2. Одна и та же информация, размещенная на разных страницах, затрудняет получение статистики о данных страницах.

Как настроить канонические адреса

Рассмотрим способы настройки «канонических» URL:

  1. Следует указать, какой URL считается основным. Сделать это можно при помощи атрибута rel="canonical" тега link. Например, на сайте присутствует несколько страниц с идентичным содержимым. Для того чтобы задать URL https://example.com/buyingcar в качестве основного, указываем на страницах с дублируемым контентом в блоке head кода страницы тег вида . В данной ситуации вы задаете главный URL, который в дальнейшем будет использован для просмотра сообщения о покупке автомобилей. Также эта страница будет показываться в результатах поисковой выдачи. Предпочтительнее задавать адрес сайта в абсолютном виде (https://example.com/buyingcar), избегайте относительных путей (/buyingcar).
  2. В карту сайта добавляем только канонические URL, в таком случае вы сможете сообщить поисковому роботу, какие страницы сайта вы считаете основными. При индексировании сайта поисковой робот не будет заходить на неканонические страницы, тем самым быстрее индексируя сайт.
  3. Для различных CMS существуют различные плагины, которые позволяют настроить канонические URL, например, для WordPress можно воспользоваться Yoast SEO .

Для OpenCart настройка атрибута canonical производится средствами CMS. Необходимо зайти в настройки товара и задать параметр SEO URL.

Для настройки canonical в Joomla нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel="canonical" (с указанием URL на страницу с настроенным ЧПУ).

Как проверить дублированный контент

Проверить, настроен canonical для страниц вашего сайта или нет, можно с помощью следующих инструментов:

1. Для проверки настройки canonical, открываем html-код страницы и проверяем наличие атрибута canonical у тега link (в блоке кода страницы).

Также проверить контент на наличие дублей можно с помощью операторов поиска, рассмотрим на примере Google. Для этого нужно ввести в поисковую строку site:имя_домена "запрос", в итоге аналогично поиску от Яндекса по результатам поисковой выдачи делаем вывод о наличии дублированного контента.

3. Еще один способ найти дублируемый контент – уникальность. В этом нам помогут специальные программы и сервисы, мы рассмотрим на примере сервиса text.ru. Для анализа необходимо добавить информацию со страницы вашего сайта в сервис и запустить проверку. В результате вы увидите, на каких сайтах в Интернете есть такой же текст, и на сколько процентов ваш текст совпадает с текстами других сайтов.

Итог

Грамотно настроенный canonical повышает эффективность работы и ускоряет индексирование сайта. Если у вас не получится самостоятельно это сделать, то вы можете обратиться к нашим специалистам , и мы сделаем настройку rel="canonical" для вашего сайта.

Как указать каноническую страницу из числа одинаковых или похожих

Если у вас есть одна страница, доступная по нескольким URL, или разные страницы с похожим контентом (например, версии для мобильных устройств и компьютеров), Google будет считать один URL каноническим , а остальные – его копиями . Сканирование канонического URL будет выполняться намного чаще, чем его копий.

Сообщите нам, какой из URL является каноническим. В противном случае мы выберем его самостоятельно или будем считать оба адреса равноценными, а это может привести к нежелательным последствиям. Дополнительные сведения представлены в разделе ниже, где говорится о том, для чего нужно выбирать канонический URL .

Как указать каноническую страницу

Существует несколько способов указать каноническую страницу из числа повторяющихся:

Способ Описание
Рекомендации, которые имеют силу независимо от выбранного способа нормализации URL.

Добавьте в код всех повторяющихся страниц тег .

Плюсы

Минусы

  • Увеличивает размер страницы.
  • Работает только с HTML-страницами, но не с файлами, такими как PDF. Для последних можно использовать атрибут rel=canonical в HTTP-заголовке.

Включите в ответ страницы заголовок rel=canonical.

Плюсы

  • Не увеличивает размер страницы.
  • Так можно пометить сколько угодно страниц.

Минусы

  • Разметка на крупных сайтах или ресурсах, на которых URL часто меняются, отнимает много усилий.

Укажите канонические страницы в файле Sitemap.

Плюсы

  • Легко настроить и обновлять, особенно на крупных сайтах.

Минусы

  • Роботу Googlebot тем не менее нужно определить повторяющуюся страницу для каждой канонической, которую вы укажете в файле Sitemap.
  • Менее значимый сигнал для робота Googlebot, чем атрибут rel=canonical.
Используйте код статуса 301, чтобы сообщить роботу Googlebot, что URL, заданный в качестве нового адреса страницы, ведет на ее более актуальную версию.
Вариант страницы в формате AMP Если один из вариантов страницы – AMP, укажите каноническую страницу и ее варианты согласно инструкциям для AMP.

Общие положения

Ниже приведены общие инструкции по указанию канонических URL.

Общие положения

  • Не обозначайте канонические страницы с помощью файла robots.txt .
  • Не используйте инструмент удаления URL для указания канонической страницы: в этом случае из результатов поиска будут удалены все варианты URL.
  • Не указывайте разные URL одной страницы в качестве канонических одним и тем же или разными способами (например, не надо добавлять один URL, используя файл Sitemap, другой – с помощью атрибута rel="canonical").
  • Не пытайтесь предотвратить выбор канонической страницы, применяя директиву noindex . Она предназначена для исключения страницы из индекса.
  • Обязательно выделяйте каноническую страницу при использовании атрибутов hreflang . Выбирайте для этого страницу на том же языке или ее вариант на наиболее близком языке.

    Используйте канонический URL при настройке ссылок на своем сайте. Это поможет нам понять, какую страницу вы считаете приоритетной.

О преимуществах HTTPS по сравнению с HTTP в канонических URL

При определении канонических ссылок Google отдает предпочтение страницам HTTPS, если при этом не возникают проблемы, например следующие:

  • Страница HTTPS использует недействительный сертификат SSL.
  • Страница HTTPS содержит небезопасные зависимости (кроме изображений).
  • Страница HTTPS выполняет переадресацию на страницу HTTP.
  • Страница HTTPS указывает на страницу HTTP с помощью атрибута rel="canonical" .

Кроме того, вы можете дополнительно указать, что адресу HTTPS следует отдавать предпочтение. Вот как это сделать:

  • Добавьте переадресацию с HTTP-страницы на HTTPS.
  • Добавьте ссылку rel="canonical" , ведущую со страницы HTTP на страницу HTTPS.
  • Используйте протокол HSTS .

Как предотвратить использование страницы HTTP в качестве канонической:

  • Проверяйте сертификаты SSL, а также ссылки со страницы HTTPS на HTTP. Ошибки в них могут привести к тому, что каноническим будет считаться адрес HTTP. При этом реализация протокола HSTS не имеет значения.
  • В файлах Sitemap и компонентах указывайте страницу HTTPS, а не HTTP.
  • Не используйте сертификат SSL/TLS для некорректного хоста (например, если example.com передает сертификат для www.example.com). Этот сертификат должен соответствовать полному URL сайта или являться групповым, то есть пригодным для использования на нескольких субдоменах.

Только для опытных пользователей: как заставить роботов Google игнорировать динамические параметры

Вы можете сообщить Google о параметрах, которые следует игнорировать. Подробные сведения представлены в Справочном центре . При использовании этой функции наши роботы не будут обрабатывать повторяющийся контент, что упростит им работу. Например, если вы укажете, что нужно проигнорировать параметр sessionid , мы посчитаем идентичными следующие страницы:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Способы

Указать канонический URL для повторяющихся URL или похожих страниц можно одним из способов, описанных ниже.

Какой бы способ вы ни выбрали, обязательно следуйте приведенным выше общим рекомендациям.

Используйте атрибут rel="canonical"

Используйте в заголовке страницы тег . Он указывает, что соответствующая страница копирует другую.

Предположим, вы хотите указать страницу https://example.com/dresses/green-dresses , содержание которой воспроизводится на других, в качестве канонической. Выполните следующие действия:

    Пометьте все повторяющиеся страницы с помощью элемента link с атрибутом rel="canonical". Добавьте в раздел этих страниц элемент , содержащий атрибут rel="canonical" и ссылку на каноническую страницу:

    Если у канонической страницы есть вариант для мобильных устройств, добавьте элемент link с атрибутом rel="alternate" и ссылкой на мобильную версию:

    В случае необходимости добавьте атрибуты hreflang или настройте переадресацию другими способами .

Используйте следующую структуру URL: https://www.example.com/dresses/green/greendress.html
Не применяйте такой вариант: /dresses/green/greendress.html

Используйте HTTP-заголовок rel="canonical"

Если у вас есть доступ к настройкам сервера, можно указывать канонический URL для документов в формате, отличном от HTML (например, PDF), с помощью атрибута rel="canonical" в заголовках HTTP (а не с помощью HTML-тегов).

Например, если на вашем сайте по нескольким разным URL доступен файл PDF, можно возвращать заголовок HTTP rel="canonical" , чтобы сообщить роботу Googlebot, какой из этих URL является каноническим:

Link: ; rel="canonical"

В настоящее время этот способ поддерживается только для веб-поиска.

Элементы link с атрибутом rel="canonical" должны содержать абсолютные пути, а не относительные . Подробнее:
Правильно: http://www.example.com/downloads/white-paper.pdf
Неправильно: /downloads/white-paper.pdf

Используйте файл Sitemap

Укажите канонический URL для каждой страницы в файле Sitemap . Все страницы в нем предлагаются в качестве канонических. Googlebot будет определять, какие из них являются повторяющимися (при наличии), по их контенту.

Мы не гарантируем, что URL в файле Sitemap будут рассматриваться как канонические во всех случаях. Но в целом это удобный способ для определения приоритетных URL на крупном сайте.

Не включайте в файл Sitemap неканонические страницы, если вы его используете.

Используйте код статуса 301 для URL удаленных страниц

Это позволяет исключить устаревшие адреса и обеспечить переадресацию на новые.

Предположим, на вашу страницу можно перейти по следующим URL:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Выберите один из этих адресов в качестве канонического и используйте переадресацию 301 на стороне сервера, чтобы перенаправлять на данный адрес трафик с других URL. Это один из самых надежных способов обеспечить переход пользователей и поисковых систем на нужную страницу. Код статуса 301 означает, что запрашиваемая страница находится по другому адресу.

Если у вас есть доступ к сервису веб-хостинга, попробуйте найти в представленных на нем справочных материалах документацию по настройке переадресаций 301.

Эта информация оказалась полезной?

Как можно улучшить эту статью?

Привет, друзья. Пора бы мне уже довести до логического завершения тему про управление индексацией сайта. Я вам напомню, какие методы управления индексацией вообще существуют: файл robots.txt, мета-тег robots, заголовок X-Robots-Tag, ну и 301-редирект здесь можно упомянуть, как метод борьбы с дублями, что так же является неотъемлемой частью качественной индексации. И обо всем этом я вам уже рассказывал, но есть еще один очень важный и интересный способ борьбы с дублями, в чем-то альтернатива редиректу, это атрибут rel="canonical" , который присваивается тегу link и располагается в части любой html-страницы.

Выглядит это как-то так:

Что немаловажно – данный тег поддерживается всеми поисковыми системами , в том числе нашими любимыми Яндекс и Google.

Итак, сегодня я вам расскажу, как и для чего нужно использовать тег rel canonical , в каких ситуациях он действительно эффективен, а заодно убедимся в этой самой эффективности на реальном эксперименте. Приготовьтесь:)

Для начала напомню вам о тех постах, что я затронул в начале:

Сперва стоит пройтись по теории, чтобы понять для чего данный атрибут вообще был создан, какие цели преследовались и узнать, что же рекомендуют поисковики.

Теория и справка от поисковых систем

Привожу ссылки на официальную позицию поисковых систем: Google об атрибуте rel="canonical" и Яндекс про атрибут rel="canonical" тега . Разумеется, и mail.ru тут как тут – про значение canonical в теге — не могли же они отстать от Яндекса, но это и хорошо, все под копирку, нам же проще.

Что такое каноническая страница? Это рекомендуемый экземпляр из набора страниц с очень похожим содержанием.

Зачем нужно указывать каноническую страницу? Если поисковая система видит, что страницы очень похожи или одинаковы, то согласно алгоритмам в результатах поиска появится только одна предпочтительная страница, которая, по мнению поисковой системы, лучше всего отвечает на запрос пользователя.

А как мы знаем, поисковик не всегда угадывает наши желания, потому лучше перестраховаться и указать нужную страницу самостоятельно. Сделать это можно добавив ссылку rel="canonical" в раздел неканонических версий всех страниц HTML.

Еще оказывается, можно указывать каноническую ссылку для не HTML содержимого , а, например, для pdf, doc или других файлов при помощи заголовков. Типа как X-Robots-Tag HTTP header, только тут будет Link HTTP header. Но это уже совсем для гик-маньяков, так что рассказывать об этом не буду.

Что будет, если атрибут rel="canonical" указывает на несуществующую страницу? А если каноническими назначено несколько страниц набора? В этом случае поисковая система просто проигнорирует данные правила и будет поступать, как и раньше — вычислять подходящий экземпляр из набора страниц согласно алгоритмам.

Можно ли использовать атрибут rel="canonical" для указания канонического URL на другом домене? Можно, но не нужно. Важно понимать, что атрибут canonical это всего лишь подсказка или рекомендация, а не строгое правило в отличие от редиректа, который и стоит использовать в данном случае.

На основании всего вышенаписанного, а так же по информации из других официальных источников (блоги поисковых систем и блоги их сотрудников) можно сделать выводы о том, что тег link rel="canonical":

  • Это рекомендация, а не правило, а потому может быть проигнорирован в следующих случаях:
    • Документ по каноническому адресу не существует, отдает ответ 404;
    • Каноническая страница закрыта от индексации в robots.txt или мета-тегом;
    • В html-коде страницы указано сразу несколько атрибутов rel canonical;
    • Адрес канонического документа указывает на другой домен или поддомен;
    • Присутствует цепочка назначений rel="canonical", т.е. для документа А каноническим указан документ Б, а в это время для документа Б указан каноническим документ В;
  • Необходимо указывать только для дублирующих или очень схожих страниц, а не для склейки двух разных страниц или передачи веса;
  • Адрес канонической страницы может указывать сам на себя;
  • Поддерживается всеми поисковыми системами: в Яндексе с 23 мая 2011 года, в Google с 12 февраля 2009.

Практическое применение и эксперимент

Все, с теорией покончено, теперь я вам расскажу, зачем и для чего я использую тег rel="canonical" на своих сайтах. Главное и основное – это борьба и предупреждение появления дублей. В основном это дубли, связанные с параметрами или метками в url. Не всегда уместно бороться с этими проблемами . Метки иногда очень важны, например, когда ведется кампания в контексте и в метках передаются важные статистические сведения, да и много еще чего можно отслеживать метками. Закрывать такие адреса в robots.txt мне не по душе, использовать мета роботс не получится, а редирект уничтожит все данные.

Классический пример использования канонических адресов это интернет магазины с кучей сортировок по еще большей куче различных параметров товаров – мне кажется, ради этого и придумали данный атрибут.

Это все понятно. Но вот только о самом главном для нас seo’шников нигде не сказано – а как дела обстоят с передачей ссылочного веса? Что если на неканонический адрес стоят ссылки, что же будет с канонической страницей, получит ли она от этого бонусы? А если сперва появилась ссылка, а rel="canonical" был указан позже? А что будет, если все наоборот?

Вопросов много, а официальных комментариев нет. На вопросы кто виноват и что делать, ответ один – надо ставить эксперимент! Хотел я такой эксперимент поставить, но оказалось, что его уже не так давно провел Игорь, автор блога bakalov.info , за что ему огромное спасибо.

Вот цитата с его блога о том, какова цель, какие варианты развития событий и ожидаемый результат:

Цель эксперимента: выяснить, будет ли передан «вес ссылки» со страницу А на страницу С, в том случае, если страница А ссылается на страницу Б, а на странице Б стоит rel="canonical", который указывает, что канонической страницей является страница С.

Вариант №1. Страница А ссылается на страницу Б и эта ссылка проиндексирована поисковыми системами. Через некоторое время на странице Б устанавливается rel="canonical", который указывает, что канонической является страница С, что в итоге приводит к исключению страницы Б из индекса.

Вариант №2. На странице Б устанавливается rel="canonical", который указывает, что канонической является страница С, что приводит к исключению страницы Б из индекса. Через некоторое время после этого со страницы А на страницу Б устанавливается ссылка.

Необходимо выяснить в каком из двух вариантов будет передан «вес ссылки» со страницы А на страницу С. Под «весом ссылки» я понимаю так называемый «анкорный вес», т.е. если страница акцептор ищется по тексту стоящей на нее ссылки, то считаем, что «вес ссылки» передается, если не ищется, то не передается.

Полное описание и ход эксперимента .

Я же сообщу результаты эксперимента и выводы:

Для Яндекса не имеет значения, что появилось раньше – rel="canonical", или внешняя ссылка – в любом случае «вес ссылки» будет передан с неканонического URL на канонический.

Для Google на самом деле все аналогично, хотя в посте Игоря говорится иначе: если канонический адрес был указан и страницы уже склеились, а потом появилась внешняя ссылка, то вес передается, а если внешняя ссылка появилась раньше, чем каноникал, то вес не перетекает.
Просто «перетекание» веса во втором случае заняло несколько больше времени, ведь согласно комментарию на блоге сказано, что каноническая страница все же ищется по анкорному тексту.

Короче, все работает!

В очередной раз обобщая всю информацию изложенную в посте, хочу сказать, что использовать тег link rel="canonical" нужно . В первую очередь это отличный способ предотвратить дублирование контента (особенно это касается ошибок и недоработок большинства CMS) и наложение санкций за это со стороны поисковых систем.

Удачи вам, друзья! Оставляйте комментарии и задавайте вопросы.

Доброго дня читателям. Для большинства людей канонические URL – это вещь крайне загадочная, и зачастую они могут быть ошибочно использованы для таких операций, как 301 редирект. Пользователи знают, что такие ссылки имеют отношение к SEO, но не совсем уверены в том, как их можно использовать. Говоря же о WordPress (в противовес HTML сайту), то здесь не так легко вручную прописывать канонические ссылки для каждой отдельной страницы вашего сайта, без использования плагина, так как это идет вразрез с тем, как работает шаблон системы управления содержимым сайта.

Данная статья поможет прояснить некоторые вопросы, которые могут возникнуть у пользователей WordPress в связи с использованием канонических URL. Не WordPress пользователи также найдут эту статью полезной, потому что смогут узнать основные принципы и затем применить эти правила к собственной системе управления контентом или обогатить свой опыт разработчика. Как бы то ни было, эта статья может показаться вам сложной в освоении в том случае, если у вас не достает технических знаний о WordPress или базовой информации о HTML и поисковой оптимизации (SEO). Мы осветили все термины, чтоб вы могли с ними познакомиться в первую очередь. Но, в любом случае, из этой публикации вы сможете почерпнуть тот необходимый базис, с которого можно начать гуглить, чтоб найти больше информации для получения более полной картины.

Что представляет из себя канонический URL?

Канонический URL (также известен, как rel=canonical, канонический тег и под другими названиями) – это то, на что ссылаются поисковые системы, когда они видят дублированные версии страницы на вашем сайте или же в интернет-пространстве. Сейчас этот прием используется для решения сложных проблем, связанных с дублированным контентом, так как часто он является лучшим решением, чем использование 301 редиректа.

Возможно, вы думаете, что на вашем сайте нет дублированного контента. И это здорово, если вы следите за тем, чтоб ваш контент не повторялся на множестве страниц. В противном случае, это может привести к понижению ранга вашего сайта в поисковой выдаче.

Если на вашем сайте есть повторяющийся текст, постарайтесь серьезно подумать над этой проблемой: если бы вы были поисковой системой, которая пытается ответить на запрос пользователя, вы бы выдали этому пользователю две идентичные страницы в результатах поисковой выдачи? Конечно же, нет! Это же совершенно бесполезно. Вы бы выдали им столько разных результатов (в поисковой выдаче), чтоб они могли найти то, что им необходимо.

Таким образом, если контент на вашем сайте повторяется снова и снова, ожидаемо, что Google просто не будет ранжировать такие страницы. И это нехорошо, если вы хотите занимать хоть какие-то позиции в поисковой выдаче.

Ссылки на дублированный контент, о существовании которых вы даже не подозреваете

Хорошо, теперь давайте вернемся назад и предположим, что вы все сделали правильно и уверены в том, что все ваши страницы абсолютно уникальны. Но, возможно, на вашем сайте все же присутствуют «скрытые» дублированные URLы, о которых вы знать ничего не знаете (на самом деле они не скрытые, я просто их так назвал). Это может вас удивить, но знали ли вы что поисковики воспринимают следующие URL, как полностью самостоятельные, даже не смотря на то, что для вас это одно и то же, и отображает одинаковый контент?

http://www.examplesite.com (заметили www?)

http://examplesite.com

https://examplesite.com (заметили https?)

http://www.examplesite.com/ (заметили слэш в конце?)

http://examplesite.com/index.php

Вот почему вам нужен канонический URL в теге HTML-кода всех ваших страниц. Необходимо оповестить поисковые машины о том, на какую версию типов URL приведенных выше или других они должны обращать внимание.

Это значит, что вы должны раз и навсегда решить отказаться ли вам или нет от использования www во всех ссылках вашего веб-проекта. Это должно стать вашей стратегией перелинковки сайта как внутри него, так и за его пределами. И это должны знать все, кто используют ваши URL: фрилансеры, работающие на вас, ваши партнеры, совладельцы, а также этот адрес должен быть указан во всех каталогах, где есть ваш сайт. Кроме того нужно решить, хотите ли вы слэш в конце или https (если на вашем сайте вводится специфическая информация, типа кредитных карт). Выберите один вариант и придерживайтесь его всегда. Если бы выбирать приходилось мне, я бы предпочел вариант, который используется чаще всего, чтоб снизить уровень головной боли, когда дело доходит до наведения порядка в URLах.

К счастью, если вы работаете с WordPress, большинство таких проблем решаются довольно просто. Мы расскажем вам о необходимых плагинах и действиях, которые нужно проделать далее в этой статье.

Но опять же повторюсь, что для канонических ссылок есть гораздо больше применений.

Дублированный контент, созданный таксономией

Скажем, вы написали статью и включили ее в разные категории блога и теги в WordPress (все это называется таксономией). Люди постоянно это делают. Или, например, есть у вас интернет-магазин, в котором товары заносятся в разные категории. Тогда, по замыслу, для удобства передвижения пользователей по сайту, один и тот же контент появляется по разным URL, но это приводит к появлению проблем. Например:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Вам хочется, чтоб посетители нашли эти самые «шоколадные трюфели» в обеих категориях: «сладости» и «еда». Неплохое стремление. Но на какой URL должны обращать внимание поисковые машины? Вы же помните, что они не будут ранжировать обе ссылки. Так что нужно выбрать. И вот здесь вам пригодятся канонические ссылки. Они скажут поисковым машинам «эй, на этой странице тот же контент, что и на той, пожалуйста, ранжируй эту страницу, а не ту».

Помните, что это просьба – ни одна поисковая система не обязана повиноваться вашей канонизации, и они могут ее проигнорировать, если посчитают неправильной.

Использование кроссдоменного канонического URL для дублированного контента

Это последняя причина, по которой вам нужен элемент канонический URL, который будет описан в данной статье (есть и другие, но они сложные, да и принцип использования не меняется): когда вы публикуете контент на вашем сайте, который также появляется и на других сайтах. Наиболее очевидные случаи такого дублирования – это пресс релизы. Так ваша компания публикует пресс релиз и размещает его на вашем сайте. Это вполне законно. Но, традиционно, пресс релиз – это такая штука, которую может опубликовать у себя кто угодно. Они создаются для того, чтоб ими делились и копировали. В этом заключается принцип работы сообществ дистрибьюторов, типа PRWeb . Это старый, как мир маркетинговый прием.

Но это рождает конфликт SEO интересов. Для поискового робота контент пресс релиза на вашем сайте – это то же самое, что и на сайтах его позаимствовавших. Так, где же оригинальная копия? Какую ссылку ранжировать в поисковой выдаче? Помните, что нужно выбрать только одну.

Обычно поисковые машины выбирают за вас, если только вы не предложите им свой вариант. И вы можете это сделать, использовав канонический URL. В случае пресс релизов, вы, как бы то ни было, вряд ли каждый новостной сайт будет публиковать вашу статью с каноническим URL на ваш ресурс. Помните, что для многих данный элемент не особо понятен. Я так же сомневаюсь, что кто-то будет тратить время на то, чтоб найти ресурс с исходной статьей и правильно кодировать свой HTML. Они публикуют по несколько статей в день, так что только вы можете позаботиться о правильных ссылках на вашем сайте. На вашем месте я бы поставил канонический URL на страницу, которая содержит пресс релиз, и обратился бы к копии, на странице крупного сообщества, где вы изначально разместили статью для заимствования. Например, закинем копию статьи на сайт PRweb.com (если вы используете данный сервис). Просто мои пять копеек.

Вот пример из реальной жизни, не связанный с ситуацией пресс релизов, где канонический URL пришелся весьма кстати: взгляните на статью, которую я написал о KISSmetrics около года назад:

Вскоре после этого Entrepreneur.com разместили эту статью у себя, так как у них было соглашение с KISSmetrics.

Вот URL той статьи:

http://www.entrepreneur.com/article/231237

Теперь у нас есть одинаковый контент, на который ведут две разные ссылки. Технически это дублированный контент, а дублированный контент – это «плохо», помните? Но не стоит бояться! Если вы посмотрите на исходный код Entreprenuer.com, то вы увидите это

Это говорит поисковым системам, где находится оригинальный контент, что представляет собой правильный выход из ситуации.

Это снимает подозрение в воровстве контента в глазах поисковых систем (которые не могут иначе узнать, кому именно принадлежат легальные права на публикацию контента).

Вероятно, вам бы не хотелось иметь такой сайт, на котором публикуются только чужие материалы. Тут элемент канонический URL, вряд ли поможет вам улучшить ранжирование сайта. Так что не злоупотребляйте использованием данной тактики.

Когда вы не можете использовать канонический URL для дублированного контента с другого сайта

Мне хочется осветить один момент, так как я много раз наблюдал такую ситуацию. Если вы собираетесь написать описание компании или персональную биографию на вашем сайте я бы не рекомендовал вам использовать тот же набор слов в ваших профилях в социальных сетях или на любых других сайтах. Если вы пишите одно и то же снова и снова на странице вашей компании на LinkedIn, бизнес странице на Google Plus и т. д., вы просто дублируете ваш контент. Вы не сможете использовать канонический URL на странице, посвященной компании или человеку, и сделать отсылку к профилю в социальной сети: вам не захочется чтоб такая страница ранжировалась сама по себе. В этом случае, пожалуйста, просто пишите каждый раз новое уникальное описание.

Как использовать канонические URLs в WordPress

Это можно сделать разными способами, но я расскажу вам о лучшем варианте, который мне известен: используйте плагин от Joost De Valk. Как только вы установите это расширение на вашем сайт, он начнет заботиться о вашем SEO, включая управление каноническими URL для того, что я назвал «скрытыми» URLами (смотри выше). Но все-таки стоит обратить внимание на некоторые настройки. На скрине ниже, виден экран настройки для единичной записи или страницы (так же применимо для пользовательских типов записей, если вы такие используете), и SEO-бокс WordPress содержит много полей и настроек. Для настройки канонических URL, которые пригодятся для штук типа пресс релизов и контента, дублированного на других сайтах, кликните таб “Advanced”:

Этот плагин значительно упростит для вас элемент канонический URL. Все, что нужно сделать, это ввести полный url оригинального источника вашего контента, который публикуется на данной странице. Другими словами, URL, который копирует контент, это та ссылка, которая должна использовать каноническую URL в HTML «шапки». Копированный контент теперь будет сигнализировать поисковикам о том, что он всего лишь копия. Имеет смысл, да?

Хорошо, но это всего лишь принцип. Исходя из примера, данного выше, вам может иногда захотеться указать, что вы всего лишь копируете контент, хотя это совсем не так, так как вам просто трудно контролировать распространение контента. Вы можете опубликовать пресс релиз на сайте своей компании и, если нужно, вы можете использовать атрибут для оригинального источника контента в сети синдикации, которую вы используете. В этом смысле вы будете действовать, как один из синдикаторов. (между прочим, это всего лишь мое мнение. Этот совет могут не одобрить другие SEO-эксперты. Так что используйте его на свой страх и риск. Google «клянется», что он очень хорош в идентификации оригинального источника контента, и канонические указатели – это только дополнительная подмога. Поисковые системы могут их проигнорировать).

В других случаях канонические URL, которые вы вводите, будут внутренними ссылками вашего сайта, содержащими дублированный контент. Скажем, например, вы публикуете описание вашего товара на статичной странице для оптовых покупателей. Но вы используете это же описание в разделе вашего сайта, где люди покупают товары в розницу.

Используя поле для канонического URL в SEO-настройках WordPress, вы можете подсказать поисковым машинам какую ссылку вы бы хотели, чтоб они ранжировали.

Замечание: Вам нужно выбрать версию ссылки с www или без www для каждой страницы, используя эти настройки. Плагин WordPress SEO делает это автоматически. Вам могут понадобиться эти настройки только в том случае, когда URL очень отличается или контент находится на другом домене.

Настройка https глобальной канонической URL с использованием WordPress SEO

Вот еще кое-что, что вы можете сделать с каноническими ссылками, используя плагин WordPress SEO. Если вы используете сертификаты SSL (для продаж в Интернете) вы можете сделать так, чтоб ваш канонический тег использовал https версию ваших ссылок в том случае, если страницы могут находиться и по http, и по https. Для этого идем в SEO > Permalinks и прокручиваем до «Canonical Settings» (канонические ссылки) в вашей консоли WordPress.

Кликаем на развернувшееся меню, где можно выбрать тип URL, который вы хотите сделать элементом canonical URL в теге всех ваших страниц: