IN DEZE HANDLEIDING:
Wat is dubbele inhoud of duplicate content?
Duplicate content betekent dat dezelfde dubbele inhoud op verschillende webpagina’s staat. Dit is schadelijk voor je SEO.
Interne duplicate content wordt meestal door jezelf veroorzaakt. Het komt veel voor in webwinkels, waar hetzelfde product bijvoorbeeld onder verschillende categorieën valt en er dus meerdere URL’s voor dit product zijn.
Je kunt aan het laatste deel van de URL’s zien dat het om hetzelfde model gaat, van hetzelfde merk. De verwijzing loopt alleen via een ander pad in de webshop, waardoor duplicate content ontstaat. Hier zijn verschillende oplossingen voor, die hieronder worden besproken.
Is dubbele inhoud schadelijk voor je SEO?
Volgens veel bronnen is dubbele inhoud schadelijk voor je SEO. Je zou niet verschijnen in de zoekresultaten vanwege duplicate content. Dit is niet helemaal waar.
Het is niet zo dat je wordt gestraft of verbannen uit de zoekresultaten. Je webpagina kan echter minder goed scoren door dubbele inhoud. Hoe zit het dan? Eigenlijk is het heel logisch:
Als er 2 of meer webpagina’s zijn met precies dezelfde inhoud, moet de zoekmachine een keuze maken welke pagina als eerste in de zoekresultaten verschijnt.
Als gebruiker zit je niet te wachten op twee pagina’s met dezelfde inhoud vlak onder elkaar in de zoekresultaten. Dat ondermijnt de relevantie van de zoekresultaten.
Zoekmachines (Google) moet dus kiezen welke van deze pagina’s als eerste wordt getoond in de zoekresultaten. Andere soortgelijke webpagina’s worden weggelaten.
Oplossen dubbele content probleem
Ga er van uit dat je veilig bent wanneer verschillende onderdelen op een webpagina (titels, delen van alinea’s, afbeeldingen) afwijken van het originele werk.
Dus begin daarmee. Voor gevorderden, moet je aan de slag met canonieke tags.
Wat is een canoniek tag?
Canonieke tags kunt u gebruiken om dubbele inhoudelijke problemen te voorkomen? Lees deze handleiding hoe je ze moet gebruiken en wat de meest voorkomende WordPress fouten zijn. En lees de oplossingen
Een canonical tag is een HTML-code dat de hoofdversie definieert voor dubbele of soortgelijke pagina’s. Als u dezelfde of vergelijkbare inhoud beschikbaar heeft kunt u canonieke tags gebruiken om te specificeren welke versie de hoofdversie is en dus geïndexeerd moet worden.
Handleiding canonieke tag en dubbele content
Voorkomende canonicaliserings fouten WordPress
Canonicalisering is een ietwat complex onderwerp. Er zijn dan ook veel misverstanden en misvattingen over hoe je goed kunt canonicaliseren.
Hier zijn enkele veelvoorkomende WordPress fouten die mensen maken als ze proberen te canonicaliseren:
WordPress fout 1: Het blokkeren van de gecanoniseerde URL via robots.txt
Het blokkeren van een URL in robots.txt voorkomt dat Google deze kan kruipen, wat betekent dat ze geen enkele canonieke tag op die pagina kunnen zien. Dat voorkomt op zijn beurt dat ze een “link equity” van het niet-canonieke naar het canonieke kunnen overbrengen.
WordPress fout 2: De gecanoniseerde URL instellen op ‘noindex’.
Meng nooit noindex en rel=canonical. Het zijn tegenstrijdige instructies.
Google zal meestal de canonieke tag voorrang geven op de ‘noindex’ tag, zoals John Mueller hier stelt. Maar het is nog steeds een slechte praktijk. Als u een URL wilt noindexen en canonicaliseren, gebruik dan een 301 redirect. Gebruik anders rel=canonical.
WordPress fout 3: Instellen van een 4XX HTTP statuscode voor de gecanoniseerde URL
Het instellen van een 4XX HTTP-statuscode voor een gecanoniseerde URL heeft hetzelfde effect als het gebruik van de ‘noindex’ tag: Google zal de canonieke tag niet kunnen zien en “link equity” overbrengen naar de canonieke versie.
WordPress fout 4: Canonicaliseren van alle gecanoniseerde pagina’s naar de hoofdpagina
Gepagineerde pagina’s moeten niet gecanoniseerd worden naar de eerste gepagineerde pagina in de serie. In plaats daarvan moet op alle gepagineerde pagina’s gebruik worden gemaakt van zelf-refererende gecanoniseerde pagina’s.
WordPress fout 5: geen gebruik maken van canonieke tags met hreflang
Hreflang-tags worden gebruikt om de taal en de geografische doelgroep van een webpagina te specificeren. Google stelt dat wanneer je hreflang gebruikt, je “een canonieke pagina in dezelfde taal moet specificeren, of de best mogelijke vervangende taal als een canonieke niet bestaat voor dezelfde taal”.
Info:
https://support.google.com/webmasters/answer/139066?hl=en
WordPress fout 6: Het hebben van meerdere rel=canonieke labels
Het hebben van meerdere rel=canonieke tags zal ervoor zorgen dat ze waarschijnlijk genegeerd worden door Google. In veel gevallen gebeurt dit omdat tags op verschillende punten in een systeem worden ingevoegd, bijvoorbeeld door het CMS, het thema en de plugin(s). Daarom hebben veel plugins een overschrijvingsoptie om er zeker van te zijn dat ze de enige bron zijn voor canonieke tags.
Een ander gebied waar dit een probleem kan zijn, is bij canonicals die met JavaScript zijn toegevoegd. Als u geen canonieke URL heeft opgegeven in de HTML-responsor en vervolgens een rel=canonieke tag met JavaScript toevoegt, dan moet dit worden gerespecteerd wanneer Google de pagina weergeeft. Als u echter een canonieke URL hebt opgegeven in HTML en de voorkeursversie verwisselt met JavaScript, dan stuurt u gemengde signalen naar Google.
WordPress fout 7: Rel=canoniek in de < body >
Rel=kanoniek moet alleen in de< body > sectie van een document verschijnen. Een canonieke tag in de sectie van een pagina wordt genegeerd.
Waar dit een probleem kan worden is bij de parsing van een document. Hoewel de broncode van een pagina de rel=canonical tag op de juiste plaats kan hebben, kunnen veel verschillende dingen, zoals ongesloten tags, JavaScript geïnjecteerd, of in desectie, ervoor zorgen dat devoortijdig eindigt tijdens het renderen. In deze gevallen kan een canonieke tag per ongeluk in devan een gerenderde pagina worden gegooid waar deze niet wordt gerespecteerd.
Hoe vindt u canonicalisatieproblemen in WordPress site
Het is gemakkelijk om WordPress fouten te maken met canonicalisatie, dus het loont de moeite om uw website regelmatig te controleren op problemen met betrekking tot canonical tags en deze zo snel mogelijk te repareren.
Hiervoor kunt u gebruik maken van Ahrefs’ Site Audit tool. Site Audit crawlt uw website voor meer dan 100 SEO-problemen, inclusief die met betrekking tot canonieke tags. Hier zijn de twaalf canonieke-tag-gerelateerde problemen die Site Audit kan vinden, en hoe ze te repareren:
1. Canonieke punten naar 4XX
Deze waarschuwing wordt geactiveerd wanneer één of meer pagina’s gecanoniseerd worden naar een 4XX-URL.
Waarom het een probleem is
Zoekmachines indexeren geen 4XX pagina’s omdat ze niet werken. Als gevolg daarvan negeren ze alle canonieke tags die naar dergelijke pagina’s verwijzen en eindigen ze vaak met het indexeren van de verkeerde (niet-canonieke) versie van de pagina.
Oplossing in WordPress:
Bekijk de betreffende pagina’s en vervang de dode (4XX) canonieke links door links naar werkende (200) pagina’s die u wilt laten indexeren.
2. Canonieke punten naar 5XX
Deze waarschuwing wordt geactiveerd wanneer een of meer pagina’s gecanoniseerd worden naar een 5XX-URL.
Waarom het een probleem is
5XX HTTP-statuscodes geven serverproblemen aan, die leiden tot een ontoegankelijke canonieke pagina. Het is onwaarschijnlijk dat Google ontoegankelijke pagina’s indexeert, dus het kan zijn dat de canonieke pagina’s worden genegeerd.
Oplossing in WordPress:
Vervang eventuele WordPress foutieve canonieke URL’s door geldige URL’s. Controleer of de server verkeerd geconfigureerd is als de opgegeven canoniek correct lijkt. Merk op dat dit een tijdelijk probleem kan zijn als de crawl is opgetreden toen uw site down was voor onderhoud of als de server van uw site overbelast was.
3. Canonieke punten omleiden
Deze waarschuwing wordt geactiveerd wanneer een of meer pagina’s gecanoniseerd worden naar een omgeleide URL.
Waarom het een probleem is? Canonicals moeten altijd wijzen op de meest gezaghebbende versie van een pagina. Dit is niet het geval bij het omleiden van URL’s. Als gevolg hiervan kunnen zoekmachines de canoniek verkeerd interpreteren of negeren.
Oplossing in WordPress:
Vervang de canonieke links door directe links naar de meest gezaghebbende versie van de pagina (d.w.z. een die een 200 HTTP-statuscode retourneert en niet doorverwijst).
4. Pagina’s dupliceren zonder canoniek
Deze waarschuwing wordt gegeven wanneer er één of meer dubbele of zeer gelijkaardige pagina’s bestaan die geen canonieke versie specificeren.
Waarom het een probleem is? Omdat er geen canoniek wordt gespecificeerd, zal Google proberen de meest geschikte versie te identificeren om in de zoekresultaten zelf te tonen. Dit is misschien niet de versie die u wilt laten indexeren.
Oplossing in WordPress:
Bekijk de groepen duplicaten. Kies een canonieke versie die in de zoekresultaten moet worden geïndexeerd. Specificeer dit als de canonieke versie over alle duplicaten heen (en voeg een zelfverwijzende canonieke tag toe aan de canonieke versie).
5. Hreflang naar niet-canoniek
Deze waarschuwing wordt geactiveerd wanneer één of meer pagina’s een niet-canonieke URL in hun hreflang-annotaties specificeren.
Waarom het een probleem is? Links in hreflang tags moeten altijd verwijzen naar de canonieke pagina’s. Het linken naar een niet-canonieke versie van een pagina uit hreflang-annotaties kan verwarrend en misleidend zijn voor zoekmachines.
Oplossing in WordPress:
Vervang links in de hreflang-annotaties van de betreffende pagina’s door hun canoniek.
6. Canonical URL heeft geen inkomende interne links
Deze waarschuwing wordt geactiveerd wanneer een of meer gespecificeerde canonieke URL’s geen interne inkomende links hebben.
Waarom het een probleem is? Canonical URL‘s zonder interne links zijn niet toegankelijk voor bezoekers van de website. Ergens op de site worden ze naar een niet-canonieke versie van de pagina geleid.
Oplossing in WordPress:
Vervang eventuele interne links naar gecanoniseerde pagina’s door directe links naar de gecanoniseerde.
7. Niet-canonieke pagina in sitemap
Deze waarschuwing wordt geactiveerd wanneer één of meer niet-canonieke pagina’s in de sitemap worden vermeld.
Waarom het een probleem is? Google stelt dat je geen niet-canonieke URL’s in je sitemap moet opnemen. Reden hiervoor is dat ze pagina’s in sitemaps zien als gesuggereerde canonicals. U moet alleen pagina’s vermelden die u in sitemaps wilt laten indexeren.
Oplossing in WordPress:
Verwijder niet-canonieke URL’s van uw sitemap.
8. Niet-canonieke pagina gespecificeerd als canonieke pagina
Deze waarschuwing wordt gegeven wanneer een of meer pagina’s een canonieke URL specificeren die ook gecanonicaliseerd is naar een andere pagina. Hierdoor ontstaat een “canonieke keten” waarbij pagina A gecanoniseerd wordt naar pagina B, die vervolgens gecanoniseerd wordt naar pagina C.
Kies dus 1 pagina!
Waarom het een probleem is? Canonieke kettingen kunnen zoekmachines in verwarring brengen en misleiden. Als gevolg daarvan kunnen ze de opgegeven canonieke tekens verkeerd interpreteren of negeren.
Oplossing in WordPress:
Vervang niet-canonieke links in de canonieke tags van de betreffende pagina’s door directe links naar de canonieke. Als pagina A bijvoorbeeld gecanoniseerd is naar pagina B, die dan gecanoniseerd is naar pagina C, vervang dan de gecanoniseerde link op pagina A door een link naar pagina C.
9. Open Graph URL niet overeenkomend met canoniek
Deze waarschuwing wordt geactiveerd wanneer er een mismatch is tussen de gespecificeerde canonieke en de Open Graph URL op een of meer pagina’s.
Waarom het een probleem is
Als de Open Graph URL niet overeenkomt met de canonieke, dan zal een niet-canonieke versie van een pagina worden gedeeld op sociale netwerken.
Oplossing in WordPress:
Vervang de Open Graph URL op de betreffende pagina’s door de canonieke URL. Zorg ervoor dat de twee URL’s hetzelfde zijn.
ZIJNDEEL. URL’s binnen de Open Graph-tags moeten absoluut zijn en gebruik maken van de protocollen http:// of https://, zoals het geval is bij de canoniek.
10. Canonical van HTTPS naar HTTP
Deze waarschuwing wordt geactiveerd wanneer een of meer beveiligde (HTTPS) pagina’s een niet-veilige (HTTP) versie opgeven als de canonieke.
Waarom het een probleem is
HTTPS is een rangschikkingsfactor, dus het is zinvol om veilige versies van pagina’s waar mogelijk als canoniek te specificeren.
Oplossing in WordPress:
De HTTP-pagina omleiden naar het HTTPS-equivalent. Als dat niet mogelijk is, voeg dan een rel=”canonieke” link toe van de HTTP-versie van de pagina naar de HTTPS-pagina.
SIDENOTE. Google noemt ook de implementatie van HSTS als mogelijke oplossing.
11. Canonical van HTTP naar HTTPS
Deze waarschuwing wordt geactiveerd wanneer een of meer niet-veilige (HTTP) pagina’s een veilige (HTTPS) versie als de canonieke versie opgeven.
Waarom het een probleem is
HTTPS heeft de voorkeur boven HTTP. Het hebben van een HTTP-versie van een pagina en dan de HTTPS-versie als canoniek specificeren is onlogisch.
ZIJNDEEL. Dit zal waarschijnlijk geen groot probleem veroorzaken, maar het is nog steeds de moeite waard om het te repareren als het mogelijk is.
Hoe kan ik dit oplossen?
Implementeer een 301 redirect van HTTP naar HTTPS. Vervang ook eventuele interne links naar de HTTP-versie van de pagina door directe links naar de HTTPS-versie.
12. Niet-canonieke pagina ontvangt organisch verkeer
Deze waarschuwing wordt geactiveerd wanneer één of meer niet-canonieke pagina’s in de zoekresultaten verschijnen en organisch zoekverkeer krijgen (wat niet zou moeten gebeuren).
Waarom het een probleem is? Ofwel zijn uw canonieke tags verkeerd ingesteld, ofwel heeft Google ervoor gekozen om de opgegeven canonieke tags te negeren.
Oplossing in WordPress:
Controleer of de rel=canonical tags correct zijn ingesteld op alle gerapporteerde pagina’s. Als dat niet het probleem is, gebruik dan de URL Inspectie tool in Google Search Console om te zien of ze de opgegeven canonieke URL als canoniek beschouwen. Als er sprake is van een mismatch, onderzoek dan waarom dit het geval kan zijn.