canoniek tag url label duplicate content dubbele content

Wil je leren wat canonieke tags zijn en hoe je ze kunt gebruiken om gevreesde dubbele inhoudelijke problemen te voorkomen?

Wat is een canoniek tag?

Een canonical tag (rel=”canonical”) is een stukje HTML-code dat de hoofdversie definieert voor dubbele, bijna-duplicate en soortgelijke pagina’s. Met andere woorden, als u dezelfde of vergelijkbare inhoud beschikbaar heeft onder verschillende URL’s, kunt u canonieke tags gebruiken om te specificeren welke versie de hoofdversie is en dus geïndexeerd moet worden.

Hoe ziet een canonieke tag er uit?

Canonical tags gebruiken een eenvoudige en consistente syntaxis en worden in het-gedeelte van een webpagina geplaatst:
< link rel=“canonical” href=“https://cursuswordpress.com/sample-page/” >

Dit is wat elk deel van die code betekent in gewoon Nederlands:

  • link rel=”canonical”: De link in deze tag is de master (canonieke) versie van deze pagina.
  • href=”https://cursuswordpress.com/sample-page/”: De canonieke versie is te vinden op deze URL.

Waarom zijn canonieke tags belangrijk voor SEO?

Google houdt niet van dubbele inhoud. Het maakt het moeilijker voor Google en zoekmachines om te kiezen:

  • Welke versie van een pagina te indexeren (ze indexeren er maar één!)
  • Welke versie van een pagina moet worden gerangschikt voor relevante vragen.
  • Of ze nu “link equity” op één pagina moeten consolideren, of deze opsplitsen in meerdere versies.

Te veel dubbele inhoud kan ook invloed hebben op uw “crawlbudget”. Dat betekent dat Google uiteindelijk tijd kan verspillen aan het kruipen van meerdere versies van dezelfde pagina in plaats van het ontdekken van andere belangrijke inhoud op uw website.

Canonical-tags lossen al deze problemen op. U kunt Google vertellen welke versie van een pagina ze moeten indexeren en rangschikken, en waar ze eventuele “link equity” moeten consolideren.

Als u geen canonieke URL opgeeft, neemt Google het heft in eigen handen.
Google zegt op deze link:
support.google.com/webmasters/answer/139066?hl=en

  • Als u geen canonieke URL opgeeft, zullen we vaststellen wat volgens ons de beste versie of URL is.

Op deze manier op Google vertrouwen is geen goed idee. Ze kunnen een versie van uw pagina selecteren die u niet echt canoniek wilt zijn.


Maar ik heb toch geen dubbele inhoud?

Gezien het feit dat u waarschijnlijk niet dezelfde berichten en pagina’s meerdere keren heeft gepubliceerd, is het gemakkelijk om aan te nemen dat uw website geen dubbele inhoud heeft.

Maar zoekmachines crawlen URL’s, niet webpagina’s.

Dat betekent dat ze cursuswordpress.com/product en cursuswordpress.com/product?color=rood zien als unieke pagina’s, ook al zijn het dezelfde webpagina’s met identieke of vergelijkbare inhoud.

Deze worden geparametriseerde URL’s genoemd, en ze zijn een veel voorkomende oorzaak van dubbele inhoud, vooral op e-commerce sites met gefacetteerde/gefilterde navigatie.

Bijvoorbeeld, Brown Bag Clothing verkoopt shirts. Dit is de URL voor hun hoofdcategoriepagina:

  • https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Als u alleen voor XL shirts filtert, wordt er een parameter aan de URL toegevoegd:

  • https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL

Als je dan ook nog eens filtert op alleen blauwe shirts, wordt er nog een parameter toegevoegd:

  • https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue

Dit zijn allemaal afzonderlijke pagina’s in de ogen van Google, ook al is de inhoud slechts marginaal verschillend. Maar het zijn niet alleen ecommerce sites die het slachtoffer worden van het dupliceren van inhoud.

Veel voorkomende oorzaken van dubbele inhoud

Hier zijn enkele andere veel voorkomende oorzaken van dubbele inhoud die van toepassing zijn op alle soorten websites:


  • Het hebben van geparametriseerde URL’s voor zoekparameters
    (bijv. cursuswordpress.com?q=zoekterm)
  • Het hebben van geparametriseerde URL’s voor sessie-ID’s
    (bijv. https://cursuswordpress.com?sessionid=3)
  • Het hebben van afzonderlijke afdrukbare versies van pagina’s
    (bijv. cursuswordpress.com/page en cursuswordpress.com/print/page)
  • Het hebben van unieke URL’s voor berichten in verschillende categorieën
    (bijv. cursuswordpress.com/services/SEO/ en cursuswordpress.com/specials/SEO/)
  • Het hebben van pagina’s voor verschillende typen apparaten
    (bijv. cursuswordpress.com en m.cursuswordpress.com)
  • Het hebben van AMP en niet-AMP versies van een pagina
    (bijv. cursuswordpress.com/pagina en amp.voorbeeld/pagina)
  • Dezelfde inhoud op non-www en www-varianten
    (bijv. http://cursuswordpress.com en http://www.cursuswordpress.com).
  • Het serveren van dezelfde inhoud bij non-https en https-varianten
    (bijv. http://www.cursuswordpress.com en https://www.cursuswordpress.com).
  • Dezelfde inhoud met en zonder schuine streep
    (bijv. https://cursuswordpress.com/page/ en http://www.cursuswordpress.com/page).
  • Dezelfde inhoud op standaardversies van de pagina, zoals indexpagina’s
    (bijv. https://www.cursuswordpress.com/, https://www.cursuswordpress.com/index.htm,https://www.cursuswordpress.com/index.html, https://www.cursuswordpress.com/index.php, https://www.cursuswordpress.com/default.htm, etc.).
  • Dezelfde inhoud met en zonder hoofdletters
    (bijv. https://cursuswordpress.com/page/ en http://www.cursuswordpress.com/Page/).

In deze situaties is het juiste gebruik van de canonieke tags van cruciaal belang. Bovendien zijn domeinoverstijgende dubbele inhoudelijke kwesties ook een ding. Als u content syndiceert, kunt u het beste een zelfreferentiële canonieke tag op uw artikel gebruiken en de gesyndiceerde content laten specificeren als de canonieke versie met een domeinoverstijgende canonieke tag. Dit voorkomt niet altijd dat de gesyndiceerde content in de zoekresultaten verschijnt, maar het helpt wel het risico te verkleinen dat deze hoger is dan het origineel.


De basisprincipes van canonieke tag-implementatie

Canonicals zijn eenvoudig te implementeren. We bespreken zo meteen vier verschillende manieren om dat te doen. Maar welke methode je ook kiest, er zijn vijf gouden regels die je altijd moet onthouden.

Regel 1: Gebruik absolute URL’s

Google’s John Mueller stelt op twitter dat het het beste is om geen relatieve paden te gebruiken met het rel=”canonieke” link element.

Dus u moet de volgende structuur gebruiken:
< link rel=“canonical” href=“<strong>https://cursuswordpress.com/sample-page/</strong>” >

In tegenstelling tot deze:

< link rel=“canonical” href=”<strong>/sample-page/</strong>” >

Regel #2: Gebruik kleine letters URL’s

Aangezien Google hoofdletters en kleine letters als twee verschillende URL’s kan behandelen, wilt u eerst de kleine letters op uw server forceren en vervolgens kleine letters gebruiken voor uw canonieke tags.

Regel #3: Gebruik de juiste domeinversie (HTTPS vs. HTTP)

Als u overstapt op SSL, zorg er dan voor dat u geen niet-SSL (d.w.z. HTTP) URL’s declareert in uw canonieke tags. Dit kan theoretisch leiden tot verwarring en onverwachte resultaten. Als u zich op een beveiligd domein bevindt, zorg er dan voor dat u de volgende versie van uw URL gebruikt:
< link rel=“canonical” href=“<strong>https</strong>://cursuswordpress.com/sample-page/” >

In tegenstelling tot:
< link rel=“canonical” href=“<strong>http</strong>://cursuswordpress.com/sample-page/” >

Regel #4: Gebruik zelfreferentiële canonieke tags

Google’s John Mueller zegt dat hoewel het niet verplicht is, zelf-referentiële canonieke tags worden aanbevolen.

Ik raad [het gebruik van een] zelf-referentiële canoniek aan omdat het ons echt duidelijk maakt welke pagina je wilt laten indexeren, of wat de URL moet zijn wanneer deze geïndexeerd wordt. Zelfs als je één pagina hebt, zijn er soms verschillende variaties van de URL die die pagina omhoog kunnen trekken. Bijvoorbeeld, met parameters op het einde, misschien met hoofdletters of www en non-www. Al deze dingen kunnen een beetje opgeschoond worden met een rel canonieke tag.

Aldus John

Als je niet zeker weet hoe een zelfreferentiële canoniek werkt, is het in principe een canonieke tag op een pagina die naar zichzelf wijst. Bijvoorbeeld, als de URL https://cursuswordpress.com/sample-page zou zijn, dan zou een zelfreferentiële canoniek op die pagina zijn:
< link rel=“canonical” href=“https://cursuswordpress.com/sample-page” >

De meeste moderne populaire CMS’ voegen automatisch zelfreferentie-URL’s toe, maar u moet uw ontwikkelaar deze laten hardcoderen als u een aangepast CMS gebruikt.

Regel #5: Gebruik één canonieke tag per pagina

Als de pagina meerdere gecanoniseerde tags heeft, dan zal Google beide negeren.

Lees meer op:
https://webmasters.googleblog.com/2013/04/5-common-mistakes-with-relcanonical.html

Hoe kan je canonicals implementeren?

Er zijn vijf bekende manieren om canonieke URL’s te specificeren. Dit zijn de zogenaamde canonicalisatiesignalen:

  • HTML-tag (rel=canonical)
  • HTTP-kop
  • Sitemap
  • 301 heroriëntatie*
  • Interne koppelingen

Voor de voor- en nadelen van elke methode, zie de officiële documentatie van Google.
support.google.com/webmasters/answer/139066?hl=en

1. Instellen van canonicals met behulp van rel=”canonical” HTML-tags

Het gebruik van een rel=canonical tag is de eenvoudigste en meest voor de hand liggende manier om een canonieke URL te specificeren.

Voeg eenvoudigweg de volgende code toe aan desectie van elke dubbele pagina:
< link rel=“canonical” href=“https://cursuswordpress.com/canonical-page/” >

Voorbeeld

Laten we zeggen dat je een e-commerce website hebt die t-shirts verkoopt. U wilt dat https://yourstore.com/tshirts/black-tshirts/ de canonieke URL is, ook al is de inhoud van die pagina toegankelijk via andere URL’s (bijv. https://yourstore.com/offers/black-tshirts/).

Voeg gewoon de volgende canonieke tag toe aan elke dubbele pagina:
< link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” >

Merk op dat als u een CMS gebruikt, u niet hoeft te rommelen met de code van uw pagina. Er is een makkelijkere manier.

Het instellen van canonieke tags in WordPress:

Installeer Yoast SEO en zelfreferencing canonical tags worden automatisch toegevoegd. Om aangepaste canonicals in te stellen, gebruik je de “Advanced” sectie op elke post of pagina.

canonical yoast

2. Instellen van canonicals in HTTP-headers

Voor documenten zoals PDF’s is er geen manier om canonieke tags te plaatsen in de paginakop, omdat er geen paginasectie is. In dergelijke gevallen moet u HTTP-headers gebruiken om canonicals in te stellen. U kunt ook een canoniek in HTTP-headers gebruiken op standaard webpagina’s.

Info:
geoffkenyon.com/how-to-add-canonical-tag-http-headers


3. Instelling van de canoniek in sitemaps

Google stelt dat niet-canonieke pagina’s niet in de sitemaps moeten worden opgenomen. Alleen canonieke URL’s moeten worden vermeld. Dat komt omdat Google de pagina’s in een sitemap ziet als voorgestelde canonicals. Ze zullen echter niet altijd URL’s in sitemaps selecteren als canonicals.

Info:
https://support.google.com/webmasters/answer/139066?hl=en

4. Canonicals instellen met 301 redirects

Gebruik 301 redirects wanneer u verkeer wilt omleiden van een dubbele URL en naar de canonieke versie.

Voorbeeld

Stel dat uw pagina bereikbaar is op deze URL’s:

cursuswordpress.com
cursuswordpress.com/index.php
cursuswordpress.com/home/
Kies een URL als de canonieke en stuur de andere URL’s daarheen.

U moet hetzelfde doen voor veilige HTTPS/HTTP- en www/non-www-versies van uw site. Kies één canonieke versie en stuur de andere om naar die versie.

De canonieke versie van ahrefs.com is bijvoorbeeld de HTTPS non-www URL (https://ahrefs.com). Alle volgende URL’s worden daarheen doorverwezen:

http://cursuswordpress.com/
http://www.cursuswordpress.com/
https://www.cursuswordpress.com/
Lees onze volledige handleiding voor de implementatie van 301 redirects.

5. Interne koppelingen

Hoe u van de ene pagina naar de andere linkt in uw hele site is een canonicalisatiesignaal. Hoe consistenter u bent met al deze signalen, hoe gemakkelijker het voor zoekmachines is om uw favoriete canonieke URL te bepalen. Zoals John in de video aangeeft, heeft Google ook een voorkeur voor HTTPS boven HTTP URL’s, en voor mooiere URL’s.

Google Webmaster Trends Analyst John Mueller behandelt de signalen die worden gebruikt om canonieke URL’s te bepalen in deze #AskGoogleWebmasters video:


Problemen en foute oplossen met Canonical tags

Ik heb een aparte handleiding geschreven over Canonical tags en duplicate content. L
Handleiding fouten en oplossingen met dubble content en canonical tag en Url


Conclusie

Canonical tags zijn niet zo ingewikkeld. U moet er even goed voor gaan zitten. Vergeet niet dat canonieke tags geen richtlijn zijn, maar eerder een signaal voor zoekmachines. Met andere woorden, ze kunnen een andere canoniek kiezen dan degene die u aangeeft.

U kunt de URL Inspectie tool in Google Search Console gebruiken om zowel de door de gebruiker gedeclareerde als de door Google geselecteerde canoniek te zien.
support.google.com/webmasters/answer/9012289?hl=en

Dit zijn de classificaties die Google gebruikt in het Index Coverage Status Report in Google Search Console met betrekking tot canonieke URL’s:

  • Wissel de pagina af met de juiste canonieke tag.
    Dit toont pagina’s waar u een alternatieve pagina met een canonieke tag hebt opgegeven en deze werd gerespecteerd. In principe werkt het zoals bedoeld om te consolideren naar een pagina die u hebt gekozen.
  • Dupliceren zonder door de gebruiker gekozen canoniek.
    Er zijn dubbele pagina’s en geen enkele heeft een gekozen canoniek. In dit geval heeft Google er een voor u gekozen, dus als het niet degene is die u liever heeft dan moet u een rel=canonical tag toevoegen.
  • Duplicaat, Google heeft een andere canoniek gekozen dan de gebruiker.
    Dit toont gevallen waarin Google ervoor koos om uw voorgestelde canoniek te negeren, maar toch een andere versie koos om in de index te tonen.
  • Dupliceren, ingediende URL niet geselecteerd als canoniek.
    Dit is ook een geval van het negeren van een canonicalisatiesignaal (dat wordt ingediend in een sitemap). Er is geen expliciet gemarkeerde canonieke URL in deze set van dubbele pagina’s en in dit geval is Google van mening dat er naast de ingediende URL nog een andere URL in de index moet worden getoond.