Duplicate content: Alle fabels & feiten op een rij

Home » Blog » SEO » Duplicate content: Alle fabels & feiten op een rij

Dubbele content
Bij het schrijven van content voor SEO, komt het woord duplicate content vaak naar voren. Wat is nou eigenlijk duplicate content en wat heeft dit voor invloed op de organische vindbaarheid? Om hier meer inzicht in te krijgen kijken we naar de definitie en de invloed van duplicate content. Tot slot behandelen we hoe je duplicate content het best kunt voorkomen!

 

Duplicate content: Wat is het?

Duplicate content of zoals we in het Nederlands zeggen, dubbele inhoud, betekend dat er op het internet twee (bijna) identieke pagina’s rondzweven. Deze pagina’s worden door zowel de zoekmachine als de bezoeker ervaren als identiek. Binnen duplicate content kunnen we onderscheid maken uit interne of externe duplicate content. Interne duplicate content is dubbele content binnen één en dezelfde website. Externe duplicate content is dubbele content op twee verschillende websites.

Interne duplicate content kan op verschillende manieren ontstaan. Bijvoorbeeld als een pagina meerdere URL’s heeft. Elke URL wordt namelijk gezien als uniek. Doordat er twee identieke pagina’s naast elkaar bestaan, worden deze dus gezien als dubbele content. Dit komt vaak voor als pagina’s op een website gefilterd kunnen worden. Denk aan webshops waarbij bijvoorbeeld filteropties zijn. Vaak verandert de URL bij het aanklikken van een optie en wordt de pagina daardoor onder meerdere URL’s geïndexeerd. Dit wordt door de zoekmachine gezien als duplicate content.

Externe duplicate content kan ontstaan als je bijvoorbeeld een tekst letterlijk van een andere website afhaalt. Dit kan gaan om bijvoorbeeld een blog, maar ook een uitgebreide productspecificatie van een leverancier. Als de pagina dan teveel op het origineel lijkt, wordt dit ook gezien als duplicate content.

Tegelijk kunnen we over duplicate content ook een misverstand de wereld uit helpen. De twee pagina’s hoeven namelijk niet exact hetzelfde te zijn om als duplicate content gezien te worden. Er zijn vanuit Google weliswaar geen specifieke richtlijnen omtrent dubbele content. Geschat wordt dat een pagina’s met een gelijkenis van meer dan 80 procent door Google gezien worden als duplicate content.

 

Duplicate content: Hoe slecht is het?

Het hebben van dubbele content op je website heeft invloed op je SEO. Weliswaar niet altijd direct. Dit komt omdat Google de meest relevante zoekresultaten wil tonen. Als Google aan de gebruiker vijf dezelfde zoekresultaten laat zien, dan zal deze gebruiker snel afhaken. Om dit te voorkomen probeert Google dus niet twee dezelfde resultaten naast elkaar te tonen.

Bij interne duplicate content zal maar een van de pagina’s getoond worden in Google. Tot zover geen problemen. Wel kan het hebben van meerder dezelfde pagina’s zorgen voor lagere rankings. Via links stroomt namelijk waarde door naar de pagina waarnaar gelinkt wordt. Deze waarde wordt ook wel linkjuice genoemd. Hoe meer linkjuice een pagina krijgt, hoe beter deze rankt. Als de linkjuice dus over meerdere dubbele pagina’s wordt verspreid, gaan er kansen verloren. Als de linkjuice alleen naar de unieke pagina gaat, zal deze tenslotte beter ranken.

Ook heeft het hebben van meerdere dezelfde pagina’s invloed op je crawlbudget. Je crawlbudget is het aantal pagina’s dat Google ongeveer per dag indexeert.  Stel je voor dat je crawlbudget 500 pagina’s is, maar je hebt 1200 pagina’s op je site. Dan wordt een nieuwe pagina in het slechtste geval dus pas na 3 dagen door Google gezien. Aanpassingen aan de website zullen dus minder snel door Google worden geïndexeerd als je veel dubbele pagina’s hebt.
Externe duplicate content, kan ook problemen opleveren. Google zal namelijk altijd proberen het origineel in de zoekresultaten te tonen. Andere websites met dezelfde content, zullen dus niet in de resultatenlijst vertoond worden. Helaas lukt het Google niet altijd om vast te stellen welke pagina het origineel is. Het kan daarom voorkomen dat de website van de oorspronkelijke auteur niet in de zoekresultaten weergegeven wordt.

Mocht het je toch overkomen, dan kun je het best je eigen teksten iets aanpassen. Denk aan het veranderen van de alinea’s en het toevoegen of weglaten van enkele zinnen. Ook is het aan te raden om nieuwe pagina’s tijdig in te dienen in Google Search Console. Zo weet Google altijd dat jij de rechtmatige eigenaar bent van die content. Ook biedt Google de mogelijkheid om actie te ondernemen via de Digital Millennium Copyright Act. Als een website onrechtmatig gebruikt van jouw content, kun je dit aanvechten bij Google. Google onderneemt dan juridische stappen. Meer informatie hierover is te vinden op de website van Google over de Digital Millennium Copyright Act.

Duplicate content heeft pas negatief effect op SEO als Google ziet dat de gehele website bestaat uit dubbele content. Als Google dit merkt, dan zal ongetwijfeld een penalty volgen. Google ziet dit soort websites namelijk als misleiding en manipulatie van de rangschikking.  Meer informatie hierover kun je vinden op de pagina van Google over dubbele inhoud.

 

Duplicate content: Het oplossen en het voorkomen ervan

Voor het opruimen of oplossen van duplicate content, zijn verschillende manieren. Allereerst is het belangrijk om goed inzicht te krijgen in de duplicate content die op dit moment op de website te vinden is. Hier kun je goed inzicht in krijgen met behulp van verschillende tools. Een aanrader is de dubbele content checker van SEO review tools. Je kunt dit eenvoudig per URL controleren.

Nu je inzicht hebt in de dubbele content op je website, is het tijd om maatregelen te treffen. De meest doeltreffende oplossingen worden hieronder besproken.

 

1. Redirects instellen
Met een 301 redirect (een permanente redirect) kun je alle dubbele pagina’s naar de unieke oude URL doorverwijzen. Bezoekers die dus op één van de dubbele URL’s terechtkomen, worden automatisch doorverwezen. Hierbij voeg je als het ware verschillende pagina’s samen tot één unieke versie.

2. Parameters uitsluiten
Zoals we al lazen, kunnen parameters voor veel dubbele pagina’s zorgen. Parameters zijn variabelen waarmee gegevens op de website verzameld worden. Denk hierbij aan de Google Analytics parameter. Met de Webmaster Tool van Google kun je parameters uitsluiten. Daarmee voorkom je dat de Googlebot dubbele pagina’s tegenkomt.

3. Canonical tags
Deze oplossing is speciaal ontwikkeld om duplicate content te voorkomen. Met behulp van de canonical tag kun je namelijk aangeven wat de originele pagina is. In tegenstelling tot een 301 redirect, waarbij de dubbele pagina’s verwijden, blijven bij een canonical tag de pagina wel gewoon bestaan. Met een canonical tag geef je namelijk alleen aan, welke pagina de belangrijkste is. Google begrijpt daardoor dat alle andere pagina’s niet het origineel zijn. Vaak worden deze canonical tags door het CMS van de website automatisch toegevoegd. In dat geval is het belangrijk om te controleren of de juiste pagina ingesteld staat als origineel.

4. Pagina’s uitsluiten
Duplicate pagina’s kun je ook uitsluiten met behulp van het document Robot.txt. Dit document staat op de website en is als het ware een handleiding voor de Goolgebot. Als je dubbele pagina’s in de robot.txt uitsluit, zal de Googlebot deze als het goed is niet bezoeken. Wil je precies weten hoe je dit toepast? Lees er alles over in onze blog over Robot.txt.

5. Meta Robots tag
Met behulp van meta robots tag kun je per pagina instructies geven aan Googlebot. Waar in het robots.txt, vaak de filterpagina’s worden uitgesloten, kun je met behulp van robot metatags specifiek per pagina duplicate content uitsluiten. Meta robot tags zijn stukjes code die je in het <head> gedeelte van de website zet. Er zijn vier verschillende varianten van Meta robot tags.
<meta name=”robots” content=”index, follow”> :  Indexeer deze pagina en volg de links.
<meta name=”robots” content=”noindex, nofollow”>: Indexeer deze pagina niet. Volg ook geen links.
<meta name=”robots” content=”index, nofollow”>: Indexeer de pagina maar volg geen links.
<meta name=”robots” content=”noindex, follow”>: Indexeer de pagina niet maar volg wel de links.

Een hoop informatie, maar we hopen dat alles duidelijk is. Heb je nog vragen of opmerkingen? Laat dan vooral een reactie achter. Heb je hulp nodig bij het oplossen van dubbele content, of wil je graag sparren met iemand? Neem dan vrijblijvend contact met ons op.

Relevante diensten

Meer lezen over dit onderwerp? Bekijk onze relevante diensten.

Reageren