У страницы изменился тег canonical. Атрибут link rel=“canonical” как еще один эффективный способ борьбы с дублями и не только

Канонические URL – это загадка для многих людей, и потому многие могут неправильно использовать такие URL для задания, к примеру, 301 редиректа. Люди предполагают, что эта возможность имеет отношение к SEO, однако они не знают, когда и как следует использовать их. В WordPress в частности (по сравнению с обычным HTML сайтом) может быть достаточно тяжело вручную задавать канонические URL для каждой страницы сайта без обращения к плагинам вследствие работы шаблонов темы, имеющихся в системе управления контентом.

В этой статье мы поможем разрешить некоторые пользовательские вопросы, которые связаны с каноническими URL. Пользователи, которые не работают с WordPress, также могут найти эту статью полезной для себя, поскольку в ней будут предложены основные принципы канонических адресов, применимые к любой системе управления контентом или к методам разработки.

Обратите внимание, что эта статья может показаться для вас достаточно сложной, если у вас нет технических навыков, связанных с WordPress, базовым HTML или SEO. Мы познакомим вас сначала с основными терминами. Если вдруг что-то в статье вам покажется непонятным, вы всегда можете поискать в поисковой системе ответы на возникшие вопросы.

Что представляет собой канонический URL?

Канонический URL (часто описываемый как rel=canonical, канонический тег и т.д.) – это то, что используется поисковыми системами при отсылке к материалу на вашем сайте, когда страница с материалом имеет несколько версий на вашем сайте или даже в сети. Сегодня канонические URL используются для решения некоторых сложных проблем с дублированием контента, и иногда эта возможность применяется для задания 301 редиректа.

Google предлагает прекрасное объяснение целей канонических URL . Я настоятельно рекомендую изучить его. Они сделали его максимально ясным.

Возможно, вы считаете, что ваш сайт не имеет дублированного контента. Прекрасно, если вы позаботились о том, чтобы ваш контент не повторялся на разных страницах. В противном случае это может вылиться в снижение ваших показателей в поисковой выдаче.

Если вы решили продублировать текст на вашем сайте, подумайте об этом серьезно: если бы вы были поисковой системой, которая старается дать ответ на пользовательский запрос, вы бы предложили пользователю две идентичных страницы в поисковой выдаче? Нет! Это бесполезно для людей. Вместо этого вы бы предложили столько разнообразных результатов в выдаче (SERP), сколько сможете найти, что, соответственно, полностью отвечало бы поисковым потребностям людей.

Таким образом, если вы дублируете контент на своем сайте, вы можете – и должны – ожидать, что Google не будет ранжировать все ваши страницы. Однако это не слишком хорошо, если вы думаете только о показателях поисковых систем и присутствию в SERP.

Дубли URL-адресов, о которых вы, возможно, не знали

Отлично, давайте вернемся назад и предположим, что мы убедились в уникальности наших страниц сайта. Однако у вас по-прежнему могут остаться некоторые «скрытые» дублируемые URL, о которых вы просто не знаете (в реальности они, конечно же, не скрыты). Это может удивить вас, но вы должны знать – поисковые системы видят следующие URL как совершенно обособленные, отдельные, даже если они выводят на экран один и тот же контент:

  • http://www.examplesite.com (обратили внимание на www?)
  • http://examplesite.com
  • https://examplesite.com (обратили внимание на https?)
  • http://www.examplesite.com/ (обратили внимание на слэш в конце?)
  • http://examplesite.com/index.php

Именно по этой причине нам и нужны канонические URL в теге HEAD кода HTML всех ваших страниц. Вы должны сообщить поисковым системам, какую из версий всех вышеупомянутых URL (и других версий) они должны просмотреть.

Да, вы должны принять окончательное решение о том, собираетесь ли вы использовать www или нет во всех ваших ссылках в процессе веб-маркетинга. Вы должны придерживаться одной ссылочной стратегии по всему сайту, и даже за его пределами. Все те, кто пользуется вашими URL, должны знать это: сотрудники, партнеры, каталоги, в которых вы перечислены, люди, которые ссылаются на вас – все.

Вы также должны определиться с тем, будете ли вы использовать слэш в конце URL, а также будете ли вы использовать https (если вы принимаете на сайте важную информацию, такую как, к примеру, данные кредитных карт). Выберите один вариант и придерживайтесь его. На вашем месте я бы выбрал тот, который используется чаще всего, чтобы избежать головной боли при исправлении своих URL.

К счастью, если вы пользуетесь WordPress, то большую часть этих проблем удастся решить. Мы рассмотрим разные плагины и другие вещи, которые помогут вам справиться с этим.

Однако есть и другие места, в которых канонические URL оказываются очень полезными.

Дублируемый контент, создаваемый таксономиями

Допустим, вы пишете статью, и вы включаете ту статью в многочисленные рубрики блога с разными метками в WordPress (все это называется таксономиями). Люди всегда делают это. Или, допустим, вы занимаетесь электронной коммерцией, и ваши продукты появляются в многочисленных рубриках. У нас появляется проблема: контент может быть представлен несколько раз по разным URL, что упрощает пользователям навигацию по сайту. К примеру:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Вы хотите, чтобы ваши пользователи могли найти шоколадные трюфели в двух рубриках: «candy» и «food». Это прекрасно. Но какой из двух URL должен быть проиндексирован поисковыми системами? Помните, что они не станут ранжировать оба URL. Таким образом, вы должны выбрать это самостоятельно. И именно в этом случае на первый план выходят канонические URL. Такие URL расскажут поисковым системам: «эй, этот контент точно такой же, что и на другой странице; пожалуйста, проиндексируй его».

Помните, что ни одна поисковая система не обязана повиноваться данной канонизации, и они могут проигнорировать ее, если посчитают ее неправильной.

Использование перекрестных канонических URL при дублировании контента с других сайтов

Есть самая важная причина, почему вам требуется канонический URL. Про нее мы поговорим ниже (есть и другие, но они более сложные, при этом принцип – тот же самый). Бывает так, что вы публикуете на своем сайте контент, который также появляется на других сайтах. Самый простой пример такой ситуации – синдикация (к примеру, пресс-релизы).

Допустим, ваша компания публикует пресс-релиз и передает его на ваш сайт. Это вполне нормальное явление. Однако пресс-релизы работают следующим образом: они могут бесплатно использоваться любым издателем контента. Они специально создаются для того, чтобы их копировали и распространяли. Есть даже целые сети синдикации, как, к примеру, PRWeb. Это достаточно старая форма маркетинга.

Однако она порождает проблемы с SEO. Для робота поисковой системы контент пресс-релиза на вашем сайте является точно таким же, как контент пресс-релиза на других новостных сайтах. Как понять, где оригинал? Какой URL выводить в SERP (поисковой выдаче)? Помните – вы должны его выбрать.

Обычно поисковые системы выбирают его самостоятельно, если вы ничего им не предложите. И делается такое предложение при помощи канонического URL. В случае с пресс-релизами, однако, маловероятно, что каждый небольшой новостной журнал будет задавать канонический URL, указывающий на ваш сайт. Помните, что многие про это просто не знают. Я сомневаюсь, что они будут торопиться с указанием оригинального источника контента и с соответствующим кодированием HTML. Они ведь публикуют по несколько разных статей в день.

Таким образом, вы должны позаботиться об этом на своем сайте. На вашем месте я бы использовал канонический URL на странице, содержащей ваш пресс-релиз, и ссылался бы на его копию в основной сети синдикации, в которой вы опубликовали статью для последующей дистрибуции. К примеру, вы можете сослаться на копию статьи на сайте PRweb.com (если вы используете этот сервис).

Если вы хотите увидеть живой пример ситуации, не касающейся пресс-релизов, и при этом затрагивающей канонические URL, давайте посмотрим на следующую статью, которую я написал для KISSmetrics год назад:

Вскоре после этого сайт Entrepreneur.com взял эту статью, потому что у них было соглашение с KISSmetrics (помните, у них было разрешение!)

Теперь у нас есть тот же самый контент, доступный по двум URL адресам. В техническом плане это – дублируемый контент, а это плохо! Однако не стоит бояться. Если вы посмотрите исходный код статьи на Entreprenuer.com, то вы найдете там следующее:

Это говорит поисковым системам о том, где был представлен оригинальный контент, что является верным решением. Это также снимает подозрения о краже контента в глазах поисковых роботов (которые не могут знать о ваших законных правах на публикацию работы).

Однако не стоит создавать целый сайт, состоящий из статей других людей. В этом случае канонический URL вряд ли поможет вам с ранжированием. Поэтому не злоупотребляйте данной тактикой.

В каких случаях вы не можете использовать канонические URL для внешнего дублируемого контента

Я хочу рассказать об этом, поскольку я часто сталкиваюсь с такими ситуациями. Если вы хотите вывести описание компании или персональную биографию на вашем сайте, я не рекомендую использовать те же самые слова и фразы, которые вы используете в ваших социальных профилях или в других местах сети.

Если вы задаете то же самое описание, которое указано у вас в LinkedIn или на вашей бизнес-странице Google Plus, то вы, по сути, дублируете контент. Не стоит использовать канонический URL на странице About, и подцеплять к ней ваш профиль из социальной сети. Ваша страница About должна ранжироваться самостоятельно. В таком случае, пожалуйста, используйте уникальное описание для внешнего использования. Я делаю так для всех своих клиентов.

Как использовать канонические URL в WordPress

Есть несколько способов сделать это, но я собираюсь показать вам самый лучший, которым пользуюсь я сам: просто воспользуйтесь плагином WordPress SEO от Joost De Valk.

Как только вы установите этот плагин на своем сайте, он позволит вам позаботиться о многочисленных SEO показателях, в том числе и о канонических URL. Однако плагин предлагает и другие настройки, на которые нужно обратить внимание.

На скриншоте ниже вы можете видеть, что на экране редактирования отдельной записи или страницы (плагин работает и для произвольных типов записей) панель WordPress SEO предлагает массу настроек и полей. Чтобы задать канонические URL, которые вы можете использовать для разных вещей – пресс-релизов или внешних дублей контента, – перейдите на вкладку Advanced:

Щелкните по выпадающему списку, чтобы выбрать тип URL для канонического адреса в теге head всех ваших страниц:

Когда не нужно использовать канонический URL

Во-первых, прочтите следующую в блоге Google Webmaster Central о распространенных ошибках с rel=canonical URL. Убедитесь в том, что вы – или ваш разработчик – не допустили их. Во-вторых, не используйте канонические URL в следующих ситуациях:

Когда вы хотите сделать 301 редирект

Если вы хотите перенаправить одну страницу к другой, чтобы пользователи, которые ввели старый URL или нажали на мертвую ссылку, были перенаправлены к новому URL, вам нужно использовать 301 редирект. Не используйте для этого канонические URL. Однако в SEO они часто применяются таким вот образом.

Редирект означает, что есть только одно место, где представлен контент, и вы вынуждаете пользователей перейти к этой странице. Это подходит, к примеру, в том случае, если вы перенесли свой сайт на новый домен или настроили новую структуру URL вследствие реконструкции сайта. Вы можете также использовать 301 редирект для отправки людей к версии вашего сайта с www или без www (это позволяет убедиться в том, что никто не перейдет на ваш сайт по неправильному адресу).

Благодаря каноническим адресам, вы можете иметь тот же самый контент на разных страницах в сети, и иметь один «оригинальный» источник контента. Иными словами, разные страницы, содержащие один и тот же контент, могут существовать и просматриваться пользователями.

Однако еще в 2011 году Рэнд Фишкин провел один интересный эксперимент, в котором он использовал канонический URL в хэдере всех страниц старого домена, чтобы таким образом улучшить ранжирование другого нового домена. И это сработало. Он поведал об этой истории в своей записи . Запись также объясняет, почему канонические URL так важны для кросс-доменной синдикации контента в мире SEO. Я не думаю, что сегодня это сработает, но можете попробовать в качестве эксперимента.

Когда вы хотите, чтобы поисковые системы проигнорировали вашу страницу

Помните, что rel=canonical – это не решение проблем с дублями контента. Поисковая оптимизация гораздо сложнее, и иногда более подходящее решение заключается в том, чтобы использовать файл robots для закрытия страниц от индексации. Именно поэтому плагин WordPress SEO включает в себя соответствующие опции.

Я рекомендую своим клиентам закрывать от индексации некоторые страницы, которые не являются полезными для посетителей. К примеру, зачем вам в выдаче страница Terms and Conditions, страницы входа в систему? Их там быть не должно. Лучше освободить дорогу более ценному контенту. К нему относятся продающие страницы, описания товаров и информативные записи блога.

Я также советую использовать правило no-index для страниц с очень малым количеством контента (поскольку ваш сайт в таком случае выглядит слишком несодержательным) и для архивов, которые дублируют контент. В WordPress это применимо к архивам авторов, архивам по дате, и, в моем случае, к архивам меток (поскольку они содержат тот же контент, что и архивы рубрик). Вы можете также закрыть от индексации произвольные типы записей и их архивы, если они только передают контент с других страниц вашего сайта.

Примечание: если вы что-то закрываете от индексации, то вам нужно будет удалить этот контент также из карты сайта, иначе это приведет к ошибкам в Google Webmaster Tools.

Поправляем URL-адрес для соответствия его с каноническим указателем

Помните, мы говорили выше о том, что нужно выбрать одну версию URL, которая будет использовать во всех ссылках с данного момента? Отлично, как только вы сделаете это, вам нужно будет «почистить» или исправить URL-адреса на вашем сайте и в других местах, чтобы они ссылались на выбранную вами версию. Допустим, что вы приняли решение использовать версию без www на вашем сайте. Теперь вам нужно убедиться в том, что все внешние и внутренние ссылки используют выбранную вами версию. Если нет, то надо постараться изменить URL-адреса. Да, это может показаться достаточно сложным действием, но это стоит того.

Чтобы быстро заменить все URL на своем сайте, вы можете использовать такой инструмент, как Search Replace DB . Однако используйте его только в том случае, если вы понимаете, что вы делаете.

Есть также плагины, которые позволяют провести поиск и замену через консоль WordPress. После проведенной замены удалите все, что соединено с вашей базой данных, чтобы избежать лишних рисков, связанных с безопасностью.

Чтобы справиться с мертвыми ссылками в записях и страницах, воспользуйтесь плагином, таким как, к примеру, Redirection , который выполнит эту задачу за вас.

Когда вы все это сделаете, убедитесь в том, что вы вошли в свой аккаунт Google Webmaster Tools и установили предпочтительный URL для вашего сайта. Кроме того, отправьте обе версии – с www и без www – вашего сайта в Google Webmaster Tools, чтобы задать предпочтения.

Заключение: используйте канонические URL для преимуществ в плане SEO

Надеемся, мы справились с хаосом, который имелся вокруг канонических ссылок и влияния их на SEO. Если вы по-прежнему не разобрались во всех аспектах, я рекомендую перейти по ссылкам, приведенным в данной статье. Однако самое лучшее достижение – теперь вы знаете, как использовать канонические адреса, знаете, что у них есть потенциал, который позволит добиться великолепных SEO результатов.

Дублированный контент – проблема, с которой могут справиться далеко не все владельцы бизнес-сайтов. Порой у них просто нет времени, чтобы решать эту проблему. К счастью, поисковые системы понимают, что порой тот же самый контент может быть доступен по разным URL-адресам, причем вполне законно. Поисковые системы предложили нам инструмент, который мы можем использовать – так давайте же воспользуемся им в своих интересах!

Link rel=canonical - атрибут тега , который используется для обозначения канонических страниц на сайте. Что такое канонические страницы? Каноническая страница - это страница сайта адрес которого является каноническим (предпочитаемым), в группе схожих по содержимому страниц. Проще говоря канонический URL страницы - это адрес, который будет индексироваться при наличии .

Когда нужно использовать канонические ссылки

  1. Для предупреждения появления различных дублей. Например:
    • страниц сортировок: /*sort, asc, desc, list=*;
    • дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
    • других страниц c GET-параметрами в URL;
    • дублей в результате особенностей работы CMS (движка).

    В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом: href=“https://site.ru/category-1/page-2” />

  2. Для доступных по разным URL страниц с очень похожим контентом. Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.
  3. На страницах пагинации, если в категориях сайта есть страницы «Показать всё». В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:ru /category-1/show-all” />

Как настроить канонические адреса rel=“canonical”?

Прописать между тегами любой HTML-страницы

Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.

Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.

Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:

ru /” />

Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.

В файле Sitemap

В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.

В заголовке HTTP

Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.

В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:

Link: ; rel=“canonical”

Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.

С помощью плагина

Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:

  • для WordPress можно настроить canonical с помощью Yoast SEO ;
  • в OpenCart - реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
  • для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).

301 редирект или rel=canonical

Если нет факторов, мешающих внедрить , то используйте этот вариант . Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.
Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов - наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.
Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте - используйте rel=canonical.

Основные ошибки использования rel=canonical

Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать - проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:

Не индексируемая каноническая страница

Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:

  • страница отдает ответ сервера 200;
  • на странице не установлен мета-тег robots со значением noindex;
  • страница не закрыта от индексирования в файле robots.txt.

Разные канонические URL для одной страницы

Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.

Неправильное использование абсолютных ссылок

Распространенной ошибкой является указание канонической ссылки без протокола http:// или https:// , как показано на примере ниже:

< link rel = «canonical» href = «ururu.com/ololo.html» / >

< link rel = «canonical» href = «/ololo.html» / >

либо полный абсолютный путь с протоколом:

< link rel = «canonical» href = «http://ururu.com/ololo.html» / >

Использование тега вне блока head

Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.

Канонические ссылки со страниц пагинации на первую страницу

Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров - они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.

Тег canonical при использовании hreflang

Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.

Неканонические ссылки в sitemap.xml

Помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.

Использование rel=canonical для неидентичных страниц

Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.

Канонические ссылки (атрибут тега link rel canonical) позволяет указать какую именно страницу из группы похожих или одинаковых страниц нужно индексировать. Полезность данного инструмента сложно переоценить и глупо игнорировать. Ведь именно к правильному толкованию страниц сайта поисковыми системами, в значительной степени и сводится SEO сайта. Тем более, что канонические ссылки поддерживаются практически любой современной CMS вроде Joomla или WordPress.

Не дублируйте контент и ставьте правильные ссылки!

Здравствуйте, друзья!

Сегодня будет очень важная статья, которая очень тесно пересекается с темой про дубли страниц.

Так, что внимательно вникаем и, если что-то непонятно, то пишите в комментарии. Темой обсуждения является животрепещащий атрибут rel="canonical", который призван для предотвращения дублированного контента и упрощения индексации поисковым системам.
Пройдемся по каждому вопросу по порядку, чтобы сложилась целостная картина.

Принцип работы атрибута rel="canonical"

Атрибут или тег canonical (как еще называют) используется для того, чтобы дать поисковым системам понять, какой адрес правдивый и является главным для каждой страницы на сайте.

Rel="canonical" - это один из важнейших моментов в оптимизации любого сайта, который позволяет решить проблему дублированного контента. Особая нужда в его использовании появляется при использовании различных дижков для создания сайтов, таких как: WordPress, phpBB и других.

Различные движки помимо основных страниц генерируют еще и другие документы с точно таким же контентом, но выполняющие совершенно другие задачи, например:

  • версия страницы для печати;
  • мобильная версия статьи;
  • и любые другие страницы с таким же контентом, но с другими адресами.

Если взять сайт на WordPress, то при включенной функции древовидных комментариев доступна кнопка "Ответить" под каждым комментом.

Она делает адрес совершенно другим, а вот контент никуда не изменяется. Происходит явное дублирование контента, что очень плохо.

Одним из самых действенных способов предотвратить появление такой страницы в индексе поисковых систем является добавления на все подобные страницы атрибута rel="canonical", который укажет, что только статья является предпочтительным документом для индексации, а все остальные в индекс брать не нужно.

Как прописывать rel="canonical"

На различных движках (например, WordPress) добавление атрибута rel="canonical" происходит в автоматическом режиме. Также атрибут добавляется с помощью различных SEo плагинов.

Если же хотим добавить canonical в ручном режиме, то в область ресурса стоит добавить следующую строчку.

< link rel = "canonical" href = "адрес страницы" / >

Данный строку нужно обязательно добавить в секцию шапки сайта, то есть между открывающим и закрывающим тегом . Иначе поисковые системы проигнорируют ваше указание в виде этого атрибута. Также стоит добавлять его на каждую страницу, которая не является главной и доступна по другому адресу.

Если взять в пример ситуацию выше с адресами страниц, создаваемые кнопками ответа на комментарии на WordPress, то в исходном коде каждой такой страницы можно видеть атрибут rel="canonical".

Как видим, канонический адрес указывает на основную страницу, когда исходный код я просматривал по адресу:

http://i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

http : //i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

Такая страница благодаря атрибуту канонических адресов в индекс не попадет. Поисковики прекрасно примут во внимание ваше указание.

Рассмотрев основной принцип работы данного атрибута, можно перейти к следующему вопросу материала.

В каких случаях использовать?


Теперь стоит рассмотреть основные ошибки, которые могут допускаться и их стоит избегать.

Основные ошибки


Когда разобрали основные ошибки, которых стоит избегать и которые чаще всего употребляются, стоит упомянуть плагины WordPress и некоторые моменты работы с атрибутом rel="canonical" на том движке.

Сanonical в плагинах WordPress

Начнем с одного из самых популярных решений на рынке - all in one seo pack. Плагин хорош и добавляет данный атрибут в код каждой страницы, удаляя при этом стандартный canonical, создаваемый средствами движка. Для этого стоит включить соответствующую настройку.

Существует 2 проблемы, которые могут препятствовать нормальной индексации сайта и помочь конкурентам насолить нам.

Первый момент касается неправильной работы атрибута со страницами пагинации. Выше я писал, что каждая страница должна быть каноничной. Плагин же в rel="canonical" вписывает адрес на первую страницу (на главный адрес омена) из всего списка пагинации.


Такой вариант может существовать, но он не совсем правильный, так как все страницы пагинации с большой вероятностью могут быть исключены из индекса ПС. Если это недопустимо, то проблему нужно решать.

Вторым моментом является косяк, который я описывал в соответствующей статье (). Он может помочь нашим конкурентам добавить нежелательные страницы в индекс с помощью инструментов addurl в поисковый индекс. Данный косяк конечно же исправляется и хорошо, что средствами самого же плагина, активировав определенную настройку "No Pagination for Canonical URLs".

На данном моменте тут я подробно останавливаться не буду, так как вопрос не маленький. Если хотите избежать второй проблемы при использовании этого плагина, то читайте статью по ссылке в предыдущем абзаце. Там все очень подробно расписано, что да как.

Вторым плагином на обозрении стоит Platinum seo pack. К страницам пагинации он относится с уважением. Проблема заключается лишь в дублировании rel="canonical". Просмотрев исходный код страницы, можно увидеть, что при включенной функции добавления атрибута, не убирается стандартный атрибут, выводимый движком.


Элемент инфоблока может быть привязан к нескольким разделам. Но при этом могут быть претензии Привязка к нескольким разделам приводит к тому, что страница сайта может существовать в сети под двумя и более различными адресами. Поисковые системы негативно относятся к дублированному контенту и понижают его в выдаче.

Избежать таких ситуаций помогут канонические ссылки.

Канонические (основные) ссылки указывают поисковому роботу основную страницу. Если робот найдет на сайте копии канонической страницы, то он пометит их, как малозначительные. по дублям страниц от SEO. Избежать этого помогает такое понятие как "основной раздел" элемента. Раньше основным разделом считался раздел с минимальным идентификатором, что было не совсем удобно. С версии 15.5.0 все изменилось, теперь вы можете самостоятельно задать основной раздел и, следовательно, пометить нужную страницу элемента как каноническую. Каноническая страница - это оригинальная страница или первоисточник.

Шаг 1 . Включите настройку выбора раздела в форме редактирования инфоблока на закладке Поля :

Шаг 2. В форме создания/редактирования элемента укажите основной раздел в одноименном поле:

Важно! Если в форме поле Основной раздел отсутствует, то перенастройте внешний вид. При работе с товарами, материалами статей, каталогами справочников вы зачастую
обращаете внимание на следующий момент: в форме присутствуют поля, которые не
используются на сайте. Лишние поля увеличивают размеры формы редактирования и
затрудняют внесение данных.

Облегчите свой труд, используйте инструмент настройки форм инфоблоков. Инструмент
учитывает индивидуальные потребности, позволяет настроить формы редактирования
разделов и элементов инфоблока под себя:

  • удаляйте лишние поля или целые вкладки;
  • перемещайте поля между вкладками;
  • создавайте свои вкладки.
Для каждого конкретного инфоблока формируйте свои уникальные формы и
работайте с удовольствием.

Примечание: основной раздел выбирается только среди тех разделов, к которым привязан элемент.

Пометьте страницу элемента в основном разделе как каноническую (т.е. выделите ее как основную среди дублей). Для этого:

  1. В компоненте, с помощью которого создан публичный интерфейс детальной страницы элемента, отметьте опцию
    .

    Примечание: данная опция добавлена в компоненты Новости Комплексный компонент позволяет создать новостной раздел на сайте. Доступен просмотр детальной информации, списка элементов, настройка экспорта в rss, организация голосования за новости (или другие элементы инфоблоков), настройка отзывов, вывода материалов по темам, настройки ЧПУ и многое другое. Компонент содержит 3 шаблона: .default , web20 и flat . Компонент стандартный и входит в дистрибутив модуля.

    : Контент > Статьи и новости > Новости .

    , Каталог Комплексный компонент осуществляет вывод полного каталога товаров из определенного инфоблока. Его функциональность объединяет возможности нескольких одностраничных компонентов: фильтра, компонента сравнения, вывода элементов раздела, топа элементов, связанных элементов и др. Расположив комплексный компонент на странице, можно получить полнофункциональный каталог. Компонент является стандартным и входит в дистрибутив модуля.

    Внимание ! Компонент не работает с инфоблоками, не имеющими структуры разделов. Если по логике проекта информация не должна иметь структурного деления, то необходимо создать один раздел верхнего уровня и уже в нём размещать элементы инфоблока.

    В визуальном редакторе компонент расположен по пути Контент > Каталог > Каталог .

    Компонент относится к модулю Информационные блоки.

    Порядок секций в форме настройки компонента может меняться в зависимости от выбранного шаблона.

    , Новость детально Одностраничный компонент, осуществляющий вывод детального описание новости. Компонент стандартный и входит в дистрибутив модуля.

    Контент > Статьи и новости > Новость детально .

    Компонент относится к модулю Информационные блоки.

    И Элемент каталога детально Компонент выводит детальную информацию по элементу каталога. Компонент стандартный, входит в дистрибутив модуля и содержит три шаблона: .default , board и old_version_16 (шаблон.default до версии 17.0).

    В визуальном редакторе компонент расположен по пути Контент > Каталог > Элемент каталога детально .

    Компонент относится к модулю Информационные блоки.

  2. Кроме того, проверьте корректность заполнения поля Канонический URL элемента
    в форме редактирования инфоблока.

Примечание: в вышеперечисленные компоненты, а также в компоненты Разделы с top"ом элементов Компонент выводит top элементов сгруппированных по разделам; элементы выводятся в таблице. Компонент стандартный и входит в дистрибутив модуля.

В визуальном редакторе компонент расположен по пути Контент > Каталог > Разделы с top"ом элементов .

Компонент относится к модулю Информационные блоки.

И Элементы раздела Компонент выводит список элементов раздела с указанным набором свойств. Компонент содержит пять шаблонов: .default , board , links , list и old_version_16 (шаблон.default до версии 17.0). Компонент стандартный и входит в дистрибутив модуля.

В визуальном редакторе компонент расположен по пути Контент > Каталог > Элементы раздела .

Компонент относится к модулю Информационные блоки.

Добавлена опция Использовать основной раздел для показа элемента . Она позволяет просматривать элемент только в основном разделе, несмотря на то, что переход к просмотру был осуществлен из другого раздела, к которому привязан элемент.

При настройке компонента обратите внимание на ещё две полезные опции в Дополнительных настройках :


Избегайте дублей страниц и улучшайте ваш сайт с точки зрения SEO. Используйте механизм выбора основного раздела, чтобы более гибко формировать для элемента каноническую ссылку:

  1. Отметьте флаг Разрешить выбор основного раздела для привязки .
  2. Для элемента укажите, какой раздел считать основным.
  3. Отметьте флаг Устанавливать канонический URL в настройках компонента.

Механизм выбора основного раздела позволяет более гибко формировать для элемента каноническую ссылку. Избегайте дублей и улучшайте ваш сайт с точки зрения SEO.

Если ваш сайт имеет идентичный или очень похожий контент, доступный по разным URL , тогда новый формат позволит указать тот URL , который должен возвращаться в поисковой системе. Также можно быть уверенным, что все характеристики, такие как ссылочный вес и т.д. передадутся на нужную версию адреса.

Теперь вы можете добавить этот тег, для указания вашей версии адреса, внутри тега на страницах с дублированным контентом:

Таким образом, Google поймет, что все дубликаты ссылаются на канонический адрес, указанный в теге. Дополнительные свойства адреса, такие как PageRank и связанные сигналы также перенесутся с дублированных страниц на указанную.

Подобный тег будет полезным в основном при использовании различных движков (phpBB, IPB , WordPress, и т.д., напр. сайту ipbskins.ru – разработка дизайна сайта на IPB , приходится использовать длинный robots.txt в целях избежания дублированного контента), создающих множество похожих страниц, например, это могут быть страницы:

печатной версии статьи:
http://site.ru/article01.html?print=true
текстовой версии статей для моб. телефонов:
http://site.ru/lofiversion/article01.html
дублированные из-за недостатка движка:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
и ряд других…

Этот стандарт может быть адаптирован любой поисковой машиной при индексации сайта.

Для популярного блог-движка WordPress уже разработан плагин canonical , вставляющий тег на нужные страницы. Другие популярные движки для блогов, форумов, интернет-магазинов и т.д. также в ближайшем будущем расширят свою функциональность (следите за обновлениями).

Ответы на некоторые популярные вопросы по тегу:

Является ли rel=“canonical” подсказкой или директивой?
Это подсказка, которую мы берем во внимание и во взаимодействии с другими сигналами вычисляем наиболее релевантную страницу для отображения в поисковых результатах.

Могу ли я использовать относительный путь для указания canonical, например так: ?
Да, относительные пути распознаются также, как и в обычном теге . Даже если вы введете тег с ссылкой на документ, тогда относительные пути будут считаться в соответствии с базовым URL .

Это нормально, если канонические адреса содержат не полностью дублированный контент?
Мы позволяем небольшие различия, такие как порядок сортировки в таблице продуктов. Также мы понимаем, что канонические адреса могут парситься роботом в разное время, поэтому все это нормально.

Что если rel=“canonical” возвращает 404 ошибку?
Мы продолжим индексировать ваш контент и использовать эвристический подход, для определения канонического адреса, однако, мы рекомендуем, чтобы вы использовали существующие URL в качестве канонических.

Что если rel=“canonical” ещё не проиндексирован?
Мы стараемся достучаться до канонического URL быстро. Как только мы его проиндексируем, тогда сразу же перерассмотрим подсказку rel=“canonical”.

Может ли канонический урл содержать редирект?
Да, вы можете указать редирект, в этом случае поисковая машина обработает просесс перенаправления как обычно и попытается проиндексировать новый адрес.

Что если я имею противоречивые сигналы для rel=“canonical”?
Наши алгоритмы мягкие: мы можем следовать по каноническим цепям, однако, мы настоятельно рекомендуем, чтобы вы на страницах указывали единственный канонический адрес, чтобы быть уверенным в оптимальном результате канонизации.

Может ли этот тег для ссылки предложить канонический адрес на совершенно другом домене?
Нет. Чтобы мигрировать на другой домен, более подходящ. В настоящее время Google поддерживает канонизацию внутри поддоменов или внутри одного домена. Таким образом, владельцы сайтов могут указать www.example.com вместо example.com или help.example.com , однако, не могут указать example.com вместо example-widgets.com .

Звучит интересно, но могу ли я увидеть пример?
Да, wikia.com помогла нам, как трастовый тестер. Например, вы замтетите, что исходный код по адресу http://starwars.wikia.com/wiki/Nelvana_Limited содержит rel=canonical http://starwars.wikia.com/wiki/Nelvana .

Два адреса почти идентичны, исключая то, что Nelvana_Limited, первый URL , содержит короткое сообщение возле заголовка. Это хороший пример использования тега в будущем. С rel=canonical, свойства двух адресов обьединяются и поисковые результаты отображают нужную версию.

Если у вас есть какие-либо вопросы по использованию нового тега, вы можете их задать в комментариях на официальном блоге Google для вебмастеров .

1. Помимо избавления от естественного дублированного контента (из-за недостатка движка), мы также избавляемся от дублированного контента искусственного, когда конкуренты нам пытаются насолить, добавляя в страницы с произвольными параметрами в URL .

2. Теперь нет надобности использовать robots.txt для запрета индексации таких страниц, как “печатная версия” и других дубликатов (напр. в WordPress нужно было закрывать путь /teg/) и угождать каждому поисковику отдельно (есть общие стандарты для robots.txt, но есть также и ряд особенностей работы каждого поисковика с этим файлом, поэтому мы раньше не могли предусмотреть запрет индексации некоторых страниц сразу для всех ботов).

3. Мы теперь имеем хороший инструмент для ускорения индексации сайта 🙂