Url și rel canonical nu se potrivesc. Rel="canonical" - un ghid complet pentru atributul URL canonic

04.07.2020 Efecte foto

O adresă URL canonică vă permite să spuneți motorului de căutare care link este de preferat pentru indexare. Configurarea canonical este necesară dacă aveți pagini cu același conținut pe site-ul dvs. Datorită naturii CMS-ului site-ului, paginile cu același conținut pot fi create automat la adrese URL diferite (citiți mai multe mai jos). Apariția unor astfel de pagini este posibilă din următoarele motive:

  1. Dacă ați scris același mesaj în diferite subiecte de blog, atunci există șansa ca o altă pagină de site să fie creată automat.
  2. De exemplu, aveți mai multe domenii: http://article.example.com și http://blogs.example.com. Și intenționați să publicați informații despre ambele resurse simultan. În acest caz, conținutul postat va fi duplicat.
  3. Dacă structura site-ului dvs. a fost actualizată, după care este posibil ca URL-urile paginilor site-ului să se fi modificat.

Pentru a preveni duplicarea paginilor site-ului în rezultatele căutării, trebuie să configurați adrese URL canonice, după care motorul de căutare va putea determina ce pagină trebuie indexată. Să ne uităm la motivele pentru care este importantă configurarea canonică:

  1. Dacă informații parțial sau complet identice sunt publicate pe diferite pagini ale site-ului dvs., ar trebui să indicați care pagină ar trebui considerată principală.
  2. Aceleași informații postate pe pagini diferite îngreunează obținerea de statistici despre aceste pagini.

Cum să configurați adrese canonice

Să ne uităm la modalități de a configura adrese URL „canonice”:

  1. Trebuie să specificați ce adresă URL este considerată adresa URL principală. Acest lucru se poate face folosind atributul rel="canonical" al etichetei link. De exemplu, un site are mai multe pagini cu conținut identic. Pentru a seta adresa URL https://example.com/buyingcar ca principală, indicăm o etichetă ca aceasta pe paginile cu conținut duplicat în blocul de cap al codului paginii . În această situație, setați adresa URL principală, care va fi folosită ulterior pentru a vizualiza mesajul despre cumpărarea de mașini. Această pagină va apărea și în rezultatele căutării. Este de preferat să specificați adresa site-ului în formă absolută (https://example.com/buyingcar), să evitați căile relative (/buyingcar).
  2. Adăugăm doar URL-uri canonice pe harta site-ului, în acest caz îi poți spune robotului de căutare care pagini ale site-ului considerați că sunt principalele. Când indexează un site, robotul de căutare nu va merge la pagini non-canonice, indexând astfel site-ul mai rapid.
  3. Pentru diferite CMS-uri, există diverse plugin-uri care vă permit să configurați URL-uri canonice, de exemplu, pentru WordPress puteți utiliza Yoast SEO.

Pentru OpenCart, atributul canonic este configurat folosind instrumente CMS. Trebuie să accesați setările produsului și să setați parametrul URL SEO.

Pentru a configura canonical în Joomla, trebuie să activați funcția SEF în setările CMS. Odată activat, atributul rel="canonical" va fi adăugat la paginile tehnice ale opțiunii /index.php? (indicând adresa URL a paginii cu CNC-ul configurat).

Cum să verificați dacă există conținut duplicat

Puteți verifica dacă canonical este configurat pentru paginile site-ului dvs. folosind următoarele instrumente:

1. Pentru a verifica setarea canonică, deschide codul html al paginii și verifică prezența atributului canonic în eticheta de link (în bloc codul paginii).

De asemenea, puteți verifica conținutul pentru duplicate folosind operatorii de căutare, să ne uităm la Google ca exemplu. Pentru a face acest lucru, trebuie să introduceți „interogare” în linia de căutare site:domain_name ca rezultat, similar unei căutări din Yandex, pe baza rezultatelor căutării, concluzionăm că există conținut duplicat.

3. O altă modalitate de a găsi conținut duplicat este unicitatea. Programele și serviciile speciale ne vor ajuta în acest sens, vom analiza exemplul serviciului text.ru. Pentru a analiza, trebuie să adăugați informații de pe pagina site-ului dvs. la serviciu și să efectuați o scanare. Ca urmare, veți vedea ce site-uri de pe Internet au același text și ce procent din textul dvs. se potrivește cu textele altor site-uri.

Concluzie

Un canonic configurat corespunzător îmbunătățește eficiența muncii și accelerează indexarea site-ului. Dacă nu puteți face acest lucru singur, puteți contacta specialiștii noștri și vom configura rel="canonical" pentru site-ul dvs.

Cum să specificați o pagină canonică dintre aceleași sau similare

Dacă aveți o pagină accesibilă din mai multe adrese URL sau pagini diferite cu conținut similar (de exemplu, versiuni pentru mobil și desktop), Google va lua în considerare o singură adresă URL canonic, iar restul sunt ale lui copii. Adresa URL canonică va fi accesată cu crawlere mult mai des decât copiile sale.

Spuneți-ne care URL este cea canonică. În caz contrar, o vom alege noi înșine sau vom considera ambele adrese ca fiind egale, iar acest lucru poate duce la consecințe nedorite. Pentru mai multe informații, consultați secțiunea de mai jos despre De ce trebuie să alegeți o adresă URL canonică?.

Cum să specificați o pagină canonică

Există mai multe moduri de a specifica o pagină canonică între duplicate:

Mod Descriere
Recomandări care se aplică indiferent de metoda de normalizare URL pe care o alegeți.

Adăugați o etichetă la codul tuturor paginilor duplicate .

Pro

Contra

  • Mărește dimensiunea paginii.
  • Funcționează numai cu pagini HTML, nu cu fișiere precum PDF. Pentru acesta din urmă, puteți utiliza atributul rel=canonic din antetul HTTP.

Includeți antetul rel=canonic în răspunsul paginii.

Pro

  • Nu mărește dimensiunea paginii.
  • Puteți marca în acest fel câte pagini doriți.

Contra

  • Marcarea pe site-uri sau resurse mari unde adresele URL se modifică frecvent necesită mult efort.

Specificați pagini canonice în harta site-ului dvs.

Pro

  • Ușor de configurat și actualizat, în special pe site-uri mari.

Contra

  • Cu toate acestea, Googlebot trebuie să definească o pagină care se repetă pentru fiecare pagină canonică pe care o specificați în harta site-ului dvs.
  • Un semnal mai puțin semnificativ pentru Googlebot decât atributul rel=canonic.
Utilizați codul de stare 301 pentru a spune Googlebot că adresa URL pe care ați setat-o ​​ca nouă adresă a paginii indică o versiune mai actuală a paginii.
Opțiune de pagină în format AMP Dacă una dintre variantele de pagină este AMP, specificați pagina canonică și variantele acesteia conform instrucțiunilor AMP.

Prevederi generale

Mai jos sunt instrucțiuni generale pentru specificarea adreselor URL canonice.

Prevederi generale

  • Nu desemnați pagini canonice folosind fișierul robots.txt.
  • Nu utilizați Instrument de eliminare a adreselor URL pentru a specifica o pagină canonică: în acest caz, adresele URL vor fi eliminate din rezultatele căutării Toate Opțiuni URL.
  • Nu specifica URL-uri diferite ale aceleiași pagini ca canonice în același mod sau în moduri diferite (de exemplu, nu trebuie să adăugați o adresă URL folosind fișierul Sitemap, alta folosind atributul rel="canonical").
  • Nu încerca să previi selectarea unei pagini canonice folosind directiva noindex. Este conceput pentru a exclude o pagină din index.
  • Asigurați-vă că evidențiați pagina canonică atunci când utilizați atributele hreflang. Pentru a face acest lucru, alegeți o pagină în aceeași limbă sau versiunea acesteia în limba cea mai apropiată.

    Utilizare URL canonic atunci când configurați link-uri pe site-ul dvs. Acest lucru ne va ajuta să înțelegem ce pagină acordați prioritate.

Beneficiile HTTPS peste HTTP în adrese URL canonice

Când determină linkuri canonice, Google preferă paginile HTTPS, cu excepția cazului în care există probleme precum următoarele:

  • Pagina HTTPS folosește un certificat SSL nevalid.
  • Pagina HTTPS conține dependențe nesigure (cu excepția imaginilor).
  • Pagina HTTPS redirecționează către pagina HTTP.
  • O pagină HTTPS indică o pagină HTTP folosind atributul rel="canonical".

În plus, puteți specifica opțional că adresa HTTPS ar trebui să fie preferată. Iată cum să o faci:

  • Adăugați o redirecționare de la o pagină HTTP la HTTPS.
  • Adăugați un link rel="canonic" de la pagina HTTP la pagina HTTPS.
  • Utilizați protocolul HSTS.

Cum preveni folosind o pagină HTTP ca canonică:

  • Verificați certificatele SSL, precum și linkurile de la HTTPS la paginile HTTP. Erorile din ele pot face ca adresa HTTP să fie considerată canonică. În acest caz, implementarea protocolului HSTS nu contează.
  • În Sitemap-uri și componente, specificați o pagină HTTPS și nu o pagină HTTP.
  • Nu utilizați un certificat SSL/TLS pentru o gazdă nevalidă (de exemplu, dacă example.com transmite un certificat pentru www.example.com). Acest certificat trebuie să se potrivească cu adresa URL completă a site-ului sau să fie un certificat de grup, adică potrivit pentru utilizare pe mai multe subdomenii.

Numai pentru utilizatori avansați: Cum să faceți Googlebots să ignore parametrii dinamici

Puteți spune Google ce setări să ignore. Pentru mai multe informații, consultați Centrul de ajutor. Prin utilizarea acestei funcții, roboții noștri nu vor procesa conținut duplicat, ușurându-le munca. De exemplu, dacă specificați să ignorați parametrul sessionid, vom considera următoarele pagini ca fiind identice:

  • https://www.example.com/rochii/verde.php?sessionid=273749
  • https://www.example.com/rochii/verde.php

Metode

Puteți seta o adresă URL canonică pentru adrese URL duplicate sau pagini similare utilizând una dintre metodele descrise mai jos.

Indiferent de metoda pe care o alegeți, asigurați-vă că urmați îndrumările generale de mai sus.

Utilizați atributul rel="canonic".

Utilizați o etichetă în titlul paginii . Indică faptul că pagina corespunzătoare este o copie a alteia.

Să presupunem că doriți să desemnați pagina https://example.com/rochii/rochii-verzi , al cărei conținut este reprodus pe alții, drept canonică. Urmați acești pași:

    Marcați toate paginile duplicate cu element de legătură cu atributul rel="canonic". Adăugați la secțiune element al acestor pagini , care conține atributul rel="canonical" și un link către pagina canonică:

    Dacă tu canonic paginile au o opțiune pentru dispozitive mobile, adăugați un element de legătură cu atributul rel="alternate" și un link către versiunea mobilă:

    Dacă este necesar adăugați atribute hreflang sau configurați redirecționarea în alte moduri.

Utilizați următoarea structură URL: https://www.example.com/rochii/verde/rochie verde.html
Nu utilizați această opțiune: /dresses/green/greendress.html

Utilizați antetul HTTP rel="canonic"

Dacă aveți acces la setările serverului, puteți specifica o adresă URL canonică pentru documentele non-HTML (cum ar fi PDF) utilizând atributul rel="canonical" din antetele HTTP (în loc să utilizați etichete HTML).

De exemplu, dacă site-ul dvs. are un fișier PDF disponibil de la mai multe adrese URL diferite, puteți returna un antet HTTP rel="canonical" pentru a spune Googlebot care dintre acele adrese URL este canonică:

Legătură: ; rel="canonic"

Această metodă este în prezent acceptată numai pentru căutări pe web.

Leagă elemente cu atributul rel="canonical". trebuie să conțină căi absolute, nu relative. Mai multe detalii:
Corect: http://www.example.com/downloads/white-paper.pdf
Greşit:/downloads/white-paper.pdf

Utilizați o hartă de site

Furnizați o adresă URL canonică pentru fiecare pagină din Sitemap. Toate paginile din acesta sunt oferite ca fiind canonice. Googlebot va determina care dintre ele sunt duplicate (dacă există) pe baza conținutului lor.

Noi nu garantăm că adresele URL din Sitemap vor fi tratate ca canonice în toate cazurile. Dar, în general, aceasta este o modalitate convenabilă de a determina adrese URL prioritare pe un site mare.

Nu-l porniți pagini non-canonice către Sitemap-ul dvs., dacă utilizați unul.

Utilizați codul de stare 301 pentru adresele URL ale paginilor eliminate

Acest lucru vă permite să excludeți adrese învechite și să oferiți redirecționare către altele noi.

Să presupunem că pagina dvs. poate fi accesată de la următoarele adrese URL:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Selectați una dintre aceste adrese ca adresă canonică și utilizați o redirecționare 301 pe partea de server pentru a redirecționa traficul de la alte adrese URL către acea adresă. Aceasta este una dintre cele mai fiabile modalități de a vă asigura că utilizatorii și motoarele de căutare merg la pagina potrivită. Codul de stare 301 înseamnă că pagina solicitată se află la o altă adresă.

Dacă aveți acces la un serviciu de găzduire web, încercați să căutați materialele de ajutor ale acestora pentru documentație despre configurarea redirecționărilor 301.

Au fost utile aceste informații?

Cum poate fi îmbunătățit acest articol?

Salutare prieteni. Este timpul să aduc subiectul gestionării indexării site-urilor la concluzia sa logică. Permiteți-mi să vă reamintesc ce metode de gestionare a indexării există în general: fișierul robots.txt, metaeticheta robots, antetul X-Robots-Tag și redirecționarea 301 pot fi menționate aici ca o metodă de a trata duplicatele, care este, de asemenea, o parte integrantă a indexării de înaltă calitate. Și v-am spus deja despre toate acestea, dar mai este una o modalitate foarte importantă și interesantă de a trata duplicatele, într-un fel o alternativă la o redirecționare, acesta este atributul rel="canonical", care este atribuită etichetei de legătură și este localizată în parte orice pagină html.

Arata cam asa:

Ce este important - această etichetă este acceptată de toate motoarele de căutare, inclusiv iubiții noștri Yandex și Google.

Asa ca astazi iti spun, cum și de ce trebuie să utilizați eticheta rel canonical, în ce situații este cu adevărat eficient și, în același timp, vom verifica tocmai această eficacitate într-un experiment real. Pregateste-te :)

Mai întâi, permiteți-mi să vă reamintesc postările pe care le-am atins la început:

În primul rând, merită să parcurgem teoria pentru a înțelege de ce a fost creat acest atribut în primul rând, ce obiective au fost urmărite și pentru a afla ce recomandă motoarele de căutare.

Teorie și ajutor din motoarele de căutare

Iată link-uri către poziția oficială a motoarelor de căutare: Google despre atributul rel="canonical" și Yandex despre atributul etichetei rel="canonical" . Desigur, mail.ru este chiar acolo - despre semnificația canonic în etichetă - nu au putut rămâne în urma Yandex, dar asta e bine, totul este o copie carbon, este mai ușor pentru noi.

Ce este o pagină canonică? Aceasta este o copie recomandată dintr-un set de pagini cu conținut foarte asemănător.

De ce trebuie să specificați o pagină canonică? Dacă motorul de căutare vede că paginile sunt foarte asemănătoare sau la fel, atunci conform algoritmilor, în rezultatele căutării va apărea o singură pagină preferată, care, în opinia motorului de căutare, răspunde cel mai bine la întrebarea utilizatorului.

Și după cum știm, motorul de căutare nu ghicește întotdeauna dorințele noastre, așa că este mai bine să fii sigur și să specificați singur pagina dorită. Puteți face acest lucru adăugând link-ul rel="canonical" la secțiune versiuni non-canonice ale tuturor paginilor HTML.

De asemenea, se dovedește puteți specifica un link canonic pentru conținut non-HTMLși, de exemplu, pentru fișiere pdf, doc sau alte fișiere care utilizează anteturi. Un fel de antet HTTP X-Robots-Tag, doar aici va exista un antet Link HTTP. Dar acest lucru este complet pentru geek-maniaci, așa că nu voi vorbi despre asta.

Ce se întâmplă dacă atributul rel="canonical" indică o pagină inexistentă? Ce se întâmplă dacă mai multe pagini dintr-un set sunt desemnate drept canonice?

În acest caz, motorul de căutare pur și simplu va ignora aceste reguli și va acționa ca înainte - calculează o instanță potrivită dintr-un set de pagini conform algoritmilor. Este posibil să folosiți atributul rel="canonical" pentru a specifica o adresă URL canonică pe alt domeniu?

Este posibil, dar nu necesar. Este important să înțelegeți că atributul canonic este doar un indiciu sau o recomandare și nu o regulă strictă, spre deosebire de o redirecționare, care ar trebui folosită în acest caz.

  • Pe baza tuturor celor de mai sus, precum și a informațiilor din alte surse oficiale (blogurile motoarelor de căutare și blogurile angajaților acestora), putem concluziona că eticheta link rel="canonical":
    • Aceasta este o recomandare, nu o regulă și, prin urmare, poate fi ignorată în următoarele cazuri:
    • Documentul la adresa canonică nu există, returnează un răspuns 404;
    • Pagina canonică este închisă de la indexare în robots.txt sau o etichetă meta;
    • Codul html al paginii conține mai multe atribute canonice rel;
    • Adresa documentului canonic indică un alt domeniu sau subdomeniu;
  • Există un lanț de atribuții rel="canonical", adică. pentru documentul A, documentul B este indicat ca canonic, iar în acest moment, pentru documentul B, documentul C este indicat ca canonic;
  • Trebuie specificat doar pentru pagini duplicate sau foarte similare, nu pentru lipirea a două pagini diferite împreună sau pentru transferul greutății;
  • Adresa canonică a paginii poate indica la sine;

Sprijinit de toate motoarele de căutare: în Yandex din 23 mai 2011, în Google din 12 februarie 2009.

Aplicare practică și experiment Gata, teoria s-a terminat, acum va spun de ce si de ce folosesc tag-ul rel="canonical" pe site-urile mele. Acestea sunt în mare parte duplicate legate de parametrii sau etichetele din adresa URL. Nu este întotdeauna potrivit să combatem aceste probleme. Etichetele sunt uneori foarte importante, de exemplu, atunci când o campanie se desfășoară în context și informații statistice importante sunt transmise în etichete și multe alte lucruri pot fi urmărite cu etichete. Nu-mi place să închid astfel de adrese în robots.txt folosind meta roboți nu va funcționa, iar o redirecționare va distruge toate datele.

Un exemplu clasic de utilizare a adreselor canonice sunt magazinele online cu o grămadă de sortare după o mulțime și mai mare de parametri diferiți ai produsului - mi se pare că acesta este motivul pentru care a fost inventat acest atribut.

Toate acestea sunt clare. Dar nu se spune nicăieri despre cel mai important lucru pentru noi SEO - cum merg lucrurile cu transferul de link juice?

Dacă există link-uri către o adresă non-canonică, ce se va întâmpla cu pagina canonică, va primi bonusuri din aceasta? Ce se întâmplă dacă linkul a apărut primul și rel="canonical" a fost specificat mai târziu? Ce se întâmplă dacă totul este invers?

Sunt multe întrebări, dar nu există comentarii oficiale. La întrebările cine este de vină și ce să facă, există un singur răspuns - trebuie să experimentăm! Am vrut să fac un astfel de experiment, dar s-a dovedit că a fost realizat nu cu mult timp în urmă de Igor, autorul blogului bakalov.info, pentru care îi mulțumesc mult.

Iată un citat de pe blogul său despre care este scopul, care sunt opțiunile și rezultatul așteptat:

Scopul experimentului: pentru a afla dacă „greutatea linkului” va fi transferată de la pagina A la pagina C, dacă pagina A trimite la pagina B, iar pagina B are rel="canonical", ceea ce indică faptul că pagina canonică este pagina CU.

Opțiunea #1. Pagina A face legătura cu pagina B și acest link este indexat de motoarele de căutare. După ceva timp, rel="canonical" este setat pe pagina B, ceea ce indică faptul că pagina C este canonică, ceea ce duce în cele din urmă la excluderea paginii B din index.

Opțiunea #2. Pe pagina B este setat rel="canonical", ceea ce indică faptul că pagina C este canonică, ceea ce duce la excluderea paginii B din index. La ceva timp după aceasta, se stabilește o legătură de la pagina A la pagina B.

Este necesar să aflăm în care dintre cele două opțiuni va fi transferată „greutatea legăturii” din pagina A în pagina C. Prin „greutatea legăturii” mă refer la așa-numita „greutatea ancorei”, adică. dacă pagina acceptor este căutată prin textul linkului către aceasta, atunci considerăm că „greutatea linkului” este transferată, dacă nu este căutată, atunci nu este transferată;

Descrierea completă și progresul experimentului.

Pentru Yandex, nu contează ce a apărut mai întâi - rel="canonical" sau un link extern - în orice caz, „greutatea linkului” va fi transferată de la adresa URL non-canonică la cea canonică.

Pentru Google, de fapt, totul este similar, deși postarea lui Igor spune altfel: dacă adresa canonică a fost specificată și paginile erau deja lipite împreună, apoi a apărut un link extern, atunci se transferă greutatea și dacă linkul extern a apărut mai devreme decât canonic, atunci greutatea nu curge.
Doar că greutatea „curgătoare” în al doilea caz a durat puțin mai mult, pentru că conform comentariului de pe blog se spune că pagina canonică este încă căutată de textul ancora.

Pe scurt, totul funcționează!

Rezumând încă o dată toate informațiile prezentate în postare, Vreau să spun că trebuie să utilizați eticheta link rel="canonical".. În primul rând, aceasta este o modalitate excelentă de a preveni duplicarea conținutului (în special în ceea ce privește erorile și deficiențele majorității CMS-urilor) și impunerea de sancțiuni pentru aceasta de către motoarele de căutare.

Mult succes, prieteni! Lasă comentarii și pune întrebări.

Bună ziua cititorilor. Pentru majoritatea oamenilor, adresele URL canonice sunt un lucru foarte misterios și pot fi adesea folosite în mod eronat pentru lucruri precum redirecționările 301. Utilizatorii știu că astfel de link-uri sunt relevante pentru SEO, dar nu sunt complet siguri cum să le folosească. Vorbind despre WordPress (spre deosebire de un site HTML), nu este atât de ușor să scrieți manual linkuri canonice pentru fiecare pagină individuală a site-ului dvs., fără a utiliza un plugin, deoarece acest lucru este împotriva modului în care funcționează șablonul sistemului de management al conținutului site-ului.

Acest articol va ajuta la clarificarea unor întrebări pe care le pot avea utilizatorii WordPress cu privire la utilizarea URL-urilor canonice. Utilizatorii non-WordPress vor găsi acest articol util, de asemenea, deoarece pot învăța principiile de bază și apoi pot aplica aceste reguli propriului sistem de management al conținutului sau își pot îmbogăți experiența ca dezvoltator. Cu toate acestea, s-ar putea să vi se pară dificil de urmat acest articol dacă nu aveți cunoștințe tehnice despre WordPress sau informații de bază despre HTML și optimizarea pentru motoarele de căutare (SEO). Am acoperit toți termenii, astfel încât să vă puteți familiariza mai întâi cu ei. Dar, în orice caz, din această publicație puteți aduna baza necesară din care puteți începe să căutați pe Google pentru a găsi mai multe informații pentru a obține o imagine mai completă.

Ce este un URL canonic?

O adresă URL canonică (cunoscută și ca rel=canonical, o etichetă canonică și alte nume) este la care se referă motoarele de căutare atunci când văd versiuni duplicate ale unei pagini pe site-ul dvs. sau pe Internet. Această tehnică este acum folosită pentru a rezolva probleme complexe de conținut duplicat, deoarece este adesea o soluție mai bună decât utilizarea redirecționărilor 301.

S-ar putea să vă gândiți că nu există conținut duplicat pe site-ul dvs. Și acest lucru este grozav dacă te asiguri că conținutul tău nu se repetă pe multe pagini. În caz contrar, acest lucru poate duce la o clasare mai scăzută a site-ului dvs. în rezultatele căutării.

Dacă aveți text duplicat pe site-ul dvs., încercați să vă gândiți serios la această problemă: dacă ați fi un motor de căutare care încearcă să răspundă la întrebarea unui utilizator, i-ați prezenta utilizatorului două pagini identice în SERP-uri? Desigur că nu! Acest lucru este complet inutil. Le-ai oferi cât mai multe rezultate diferite (în rezultatele căutării), astfel încât să poată găsi ceea ce au nevoie.

Deci, dacă conținutul de pe site-ul dvs. este repetat din nou și din nou, este de așteptat ca Google pur și simplu să nu clasifice astfel de pagini. Și acest lucru nu este bine dacă vrei să ocupi măcar câteva poziții în rezultatele căutării.

Linkuri către conținut duplicat despre care nici măcar nu știi că există

Bine, acum să ne întoarcem și să presupunem că ați făcut totul corect și că sunteți încrezători că toate paginile dvs. sunt complet unice. Dar poate că există încă adrese URL duplicate „ascunse” pe site-ul dvs. despre care nu știți nimic (de fapt nu sunt ascunse, le-am numit doar așa). Acest lucru vă poate surprinde, dar știați că motoarele de căutare tratează următoarele adrese URL ca fiind complet independente, chiar dacă pentru dvs. sunt același lucru și afișează același conținut?

http://www.examplesite.com (observați www?)

http://examplesite.com

https://examplesite.com (observați https?)

http://www.examplesite.com/ (observați bara oblică de la sfârșit?)

http://examplesite.com/index.php

Acesta este motivul pentru care aveți nevoie de o adresă URL canonică în etichetă Codul HTML al tuturor paginilor dvs. Este necesar să anunțați motoarele de căutare despre ce versiune a tipurilor de URL de mai sus sau despre altele cărora ar trebui să le acorde atenție.

Aceasta înseamnă că trebuie să decideți odată pentru totdeauna dacă nu mai utilizați www în toate linkurile din proiectul dvs. web. Aceasta ar trebui să fie strategia dvs. pentru a vă conecta site-ul atât intern, cât și extern. Și toți cei care vă folosesc URL-ul ar trebui să știe acest lucru: liber profesioniști care lucrează pentru dvs., partenerii dvs., coproprietari, iar această adresă ar trebui să fie indicată în toate directoarele în care se află site-ul dvs. De asemenea, trebuie să decideți dacă doriți un slash final sau https (dacă site-ul dvs. necesită informații specifice, cum ar fi cardurile de credit). Alegeți o opțiune și rămâneți cu ea întotdeauna. Dacă ar fi să aleg, aș alege opțiunea care este folosită cel mai des pentru a reduce durerile de cap când vine vorba de organizarea URL-urilor.

Din fericire, dacă lucrați cu WordPress, majoritatea acestor probleme sunt destul de ușor de rezolvat. Vă vom spune despre pluginurile necesare și pașii pe care trebuie să-i faceți mai târziu în acest articol.

Dar din nou, există multe mai multe utilizări pentru link-urile canonice.

Conținut duplicat generat de taxonomie

Să presupunem că ai scris un articol și l-ai inclus în diferite categorii de blog și etichete în WordPress (toate acestea se numesc taxonomie). Oamenii fac asta tot timpul. Sau, de exemplu, aveți un magazin online în care produsele sunt listate în diferite categorii. Apoi, conform planului, pentru confortul utilizatorilor care se deplasează pe site, același conținut apare la diferite adrese URL, dar acest lucru duce la probleme. De exemplu:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Vrei ca vizitatorii să găsească aceste „trufe de ciocolată” în ambele categorii: „dulciuri” și „mâncare”. Nu este o aspirație rea. Dar la care URL ar trebui să acorde atenție motoarele de căutare? Vă amintiți că nu vor clasifica ambele link-uri. Deci trebuie să alegi. Aici sunt utile link-urile canonice. Ei vor spune motoarelor de căutare „hei, această pagină are același conținut ca pagina respectivă, vă rugăm să clasați această pagină și nu acea pagină.”

Amintiți-vă că aceasta este o solicitare - niciun motor de căutare nu este obligat să se supună canonizării dvs. și o pot ignora dacă o consideră incorectă.

Utilizarea unei adrese URL canonice pe mai multe domenii pentru conținut duplicat

Acesta este motivul final pentru care aveți nevoie de un element URL canonic, care va fi tratat în acest articol (sunt și altele, dar sunt complexe, iar principiul de utilizare nu se schimbă): atunci când publicați conținut pe site-ul dvs. care apare și pe alte site-uri. Cele mai evidente cazuri de astfel de duplicare sunt comunicatele de presă. Acesta este modul în care compania dvs. publică un comunicat de presă și îl postează pe site-ul dvs. web. Acest lucru este complet legal. Dar, în mod tradițional, un comunicat de presă este ceva pe care oricine îl poate publica. Sunt create pentru a fi partajate și copiate. Acesta este principiul de funcționare al comunităților de distribuitori, cum ar fi PRWeb. Aceasta este o tehnică de marketing la fel de veche ca timpul.

Dar acest lucru creează un conflict de interese SEO. Pentru un robot de căutare, conținutul unui comunicat de presă de pe site-ul tău este același cu cel de pe site-urile care l-au împrumutat. Deci unde este copia originală? Ce link pentru clasare în rezultatele căutării? Amintiți-vă că trebuie să alegeți doar unul.

De obicei, motoarele de căutare aleg pentru dvs., cu excepția cazului în care le oferiți propria dvs. opțiune. Și puteți face acest lucru folosind o adresă URL canonică. În cazul comunicatelor de presă, totuși, este puțin probabil ca fiecare site de știri să-ți publice articolul cu adresa URL canonică a resursei tale. Amintiți-vă că pentru mulți acest element nu este deosebit de clar. De asemenea, mă îndoiesc că oricine va petrece timp găsind o resursă cu articolul original și codificându-și HTML corect. Ei publică mai multe articole pe zi, așa că doar tu te poți ocupa de linkurile corecte de pe site-ul tău. Dacă aș fi în locul dvs., aș pune adresa URL canonică pe pagina care conține comunicatul de presă și aș face referire la copia de pe pagina mare a comunității unde ați postat inițial articolul pentru împrumut. De exemplu, să încărcăm o copie a articolului pe PRweb.com (dacă utilizați acest serviciu). Doar cei doi cenți ai mei.

Iată un exemplu real, fără un comunicat de presă, în care o adresă URL canonică este utilă: aruncați o privire la articolul pe care l-am scris despre KISSmetrics în urmă cu aproximativ un an:

La scurt timp după aceea, Entrepreneur.com a găzduit articolul deoarece au avut un acord cu KISSmetrics.

Iată adresa URL a articolului respectiv:

http://www.entrepreneur.com/article/231237

Acum avem același conținut, ceea ce duce la două link-uri diferite. Din punct de vedere tehnic, acesta este conținut duplicat, iar conținutul duplicat este „rău”, vă amintiți? Dar nu-ți fie frică! Dacă te uiți la codul sursă Entreprenuer.com, vei vedea asta

Acest lucru le spune motoarelor de căutare unde este conținutul original, care este calea corectă de urmat.

Acest lucru înlătură suspiciunea de furt de conținut în ochii motoarelor de căutare (care nu pot ști altfel cine deține exact drepturile legale de a publica conținut).

Probabil că nu ți-ai dori să ai un site care să publice doar materialele altora. Elementul URL canonic de aici este puțin probabil să vă ajute să îmbunătățiți clasarea site-ului dvs. Așa că nu abuzați de această tactică.

Când nu puteți utiliza o adresă URL canonică pentru conținut duplicat de pe alt site

Vreau să subliniez un punct pentru că am văzut această situație de multe ori. Dacă intenționați să scrieți o descriere a companiei sau o biografie personală pe site-ul dvs. web, nu v-aș recomanda să utilizați același set de cuvinte în profilurile de rețele sociale sau pe orice alte site-uri. Dacă scrieți același lucru din nou și din nou pe pagina companiei LinkedIn, pe pagina de afaceri Google Plus etc., pur și simplu vă duplicați conținutul. Nu puteți utiliza o adresă URL canonică într-o pagină despre o companie sau o persoană și să faceți un link către un profil de rețea socială, nu doriți ca pagina să se clasifice singură; În acest caz, vă rugăm să scrieți o nouă descriere unică de fiecare dată.

Cum să utilizați adrese URL canonice în WordPress

Există multe modalități de a face acest lucru, dar vă voi spune cea mai bună opțiune pe care o cunosc: folosiți un plugin de la Joost De Valk. Odată ce instalați această extensie pe site-ul dvs., va începe să aibă grijă de SEO, inclusiv gestionarea URL-urilor canonice pentru ceea ce am numit URL-uri „ascunse” (vezi mai sus). Dar merită totuși să acordați atenție unor setări. În captura de ecran de mai jos, puteți vedea ecranul de setări pentru o singură postare sau pagină (aplicabil și pentru tipurile de postări personalizate, dacă le utilizați), iar caseta WordPress SEO conține multe câmpuri și setări. Pentru a configura adrese URL canonice, care sunt utile pentru lucruri precum comunicatele de presă și conținutul duplicat pe alte site-uri, faceți clic pe fila „Avansat”:

Acest plugin va simplifica foarte mult elementul URL canonic pentru dvs. Tot ce trebuie să faceți este să introduceți adresa URL completă a sursei originale a conținutului dvs. care este publicată pe această pagină. Cu alte cuvinte, URL-ul care copiază conținutul este cel care ar trebui să folosească URL-ul canonic din antetul HTML. Conținutul copiat va semnala acum motoarele de căutare că este doar o copie. Are sens, nu?

Bine, dar acesta este doar un principiu. Pe baza exemplului dat mai sus, poate doriți să indicați uneori că doar copiați conținut atunci când nu este deloc cazul, deoarece pur și simplu vă este greu să controlați distribuția conținutului. Puteți publica un comunicat de presă pe site-ul companiei dvs. și, dacă este necesar, puteți utiliza un atribut pentru sursa de conținut originală în rețeaua de sindicare pe care o utilizați. În acest sens, vei acționa ca unul dintre sindicate. (apropo, aceasta este doar părerea mea. Este posibil ca acest sfat să nu fie aprobat de alți experți SEO. Așa că utilizați-l pe propriul risc. Google jură că este foarte bun la identificarea sursei inițiale de conținut, iar indicațiile canonice sunt doar ajutor suplimentar. Motoarele de căutare le pot ignora).

În alte cazuri, adresele URL canonice pe care le introduceți vor fi link-uri interne pe site-ul dvs. care conțin conținut duplicat. Să presupunem, de exemplu, că publicați o descriere a produsului dvs. pe o pagină statică pentru cumpărătorii angro. Dar folosești aceeași descriere în secțiunea site-ului tău unde oamenii cumpără produse cu amănuntul.

Folosind câmpul URL canonic din setările dvs. SEO WordPress, puteți spune motoarelor de căutare ce link doriți să fie clasat.

Comentariu: Trebuie să alegeți versiunea de link www sau non-www pentru fiecare pagină folosind aceste setări. Pluginul WordPress SEO face acest lucru automat. Este posibil să aveți nevoie de aceste setări numai dacă adresa URL este foarte diferită sau conținutul este pe un alt domeniu.

Configurarea URL-ului canonic global https folosind WordPress SEO

Iată altceva pe care îl puteți face cu link-urile canonice folosind pluginul WordPress SEO. Dacă utilizați certificate SSL (pentru vânzări online), puteți face ca eticheta canonică să folosească versiunea https a link-urilor dvs. dacă paginile pot fi atât pe http, cât și pe https. Pentru a face acest lucru, accesați SEO > Permalink-uri și derulați la „Setări canonice” în tabloul de bord WordPress.

Faceți clic pe meniul derulant, unde puteți selecta tipul de adresă URL pe care doriți să o creați elementul URL canonic în etichetă toate paginile tale: