Duplicate content: wat is het en hoe voorkom je het?

Duplicate content: wat is het en hoe voorkom je het?

Vorig artikel Volgend artikel

1 van de onderwerpen waar je aandacht aan moet besteden als je aan SEO doet, is duplicate content. Deze dubbele inhoud is niet alleen vervelend voor de bezoekers van je website, maar ook voor zoekmachines. Na het lezen van dit artikel weet je alles over gedupliceerde content, de verschillende soorten en hoe je het oplost.

Duplicate content in het kort

We beginnen bij het begin met de betekenis van de term. Duplicate content houdt in dat dezelfde tekst en afbeeldingen op verschillende pagina’s is terug te vinden. Dat kan binnen je eigen site zijn, maar dat hoeft niet per se. Je spreekt ook van duplicate content als er bijvoorbeeld maar 1 paragraaf gekopieerd is van een andere pagina.

Duplicate-content-tussen-sites
Bij krakende knieën krijg je op 2 verschillende websites dezelfde tips.

Het probleem van duplicate content

Als je je afvraagt hoe erg duplicate content is, dan hoeven we alleen maar even te kijken wat Google erover zegt. Het komt erop neer dat duplicate content nadelige invloed heeft op de positie van je pagina’s. Ze kunnen zelfs volledig verwijderd worden uit de index, zodat ze überhaupt niet meer in de zoekresultaten staan.

De soep wordt gelukkig niet zo heet gegeten als hij wordt opgediend, want duplicate content is op zichzelf geen reden voor zo’n zware straf. Alleen websites die bewust de zoekresultaten proberen te beïnvloeden door content van andere websites te kopiëren, worden bestraft.

Duplicate content is wel slecht voor SEO

Hoewel je niet direct bestraft wordt door Google voor duplicate content, is het niet goed voor je vindbaarheid in zoekmachines:

  1. Kopieer je een pagina? Dan bepaalt Google welke er in de zoekresultaten getoond wordt. En dat is niet altijd de pagina die jij belangrijk vindt.
  2. Gebruikers vinden het vervelend om steeds dezelfde content tegen te komen.
  3. De crawlbot van Google heeft minder tijd voor het crawlen van relevantere pagina’s.
  4. Een concurrent kan je content kopiëren en een hogere positie in de zoekresultaten pakken.

Duplicate content is trouwens niet altijd een gekopieerde tekst. Er zijn verschillende soorten.

Verschillende soorten duplicate content

Naast letterlijk gekopieerde pagina’s kan duplicate content ook per ongeluk ontstaan, bijvoorbeeld door technische instellingen van je websites.

Duplicate content door variaties in je URL

Soms maakt je website of jijzelf onbedoeld duplicate content door variaties op je standaard URL. We zien bijvoorbeeld vaak:

  • Met en zonder ‘www.’
  • Http en https.
  • Met en zonder ‘/’ aan het einde.
  • Toegevoegde parameters, bijvoorbeeld voor filters of trackingmogelijkheden
  • Parameters; een ? achter jouw url gevolgd door bijvoorbeeld een filteroptie, trackingcode of paginering.

Als je hier niet bewust mee bezig bent, kun je zomaar 5 varianten van een pagina hebben.

Technische Duplicate Content
Technische instellingen zorgen voor 5 dezelfde homepages.

Te kleine verschillen = duplicate content

Ook pagina’s waarbij de verschillen in content te klein zijn, kunnen aangemerkt worden als duplicate content. Dat zie je onder andere bij:

  • Gekopieerde lokale pagina’s waarbij alleen de plaatsnaam anders is.
  • Items in een agenda die vaker terugkomen, waarbij alleen de datum anders is.
  • Dezelfde producten met bijvoorbeeld verschillende kleuren.
  • Teksten als een missie, visie of aanbod dat op iedere pagina terugkomt.

Dezelfde inhoud op verschillende websites

Stelen is niet netjes. Het stelen van content dus ook niet. Hoewel dat helaas wel eens gebeurt, kan het ook ‘per ongeluk’ zijn dat dezelfde tekst op verschillende websites terugkomt:

  • Door de fabrikant aangeleverde informatie over een product dat op meerdere sites verkocht wordt.
  • Een persbericht dat integraal door meerdere sites wordt overgenomen.
  • De beschrijving van een evenement waar meerdere sites over informeren.

Zo ontdek je of jouw website duplicate content heeft

Zeker met grotere sites is het een niet eenvoudig om te checken of je duplicate content hebt. Gelukkig zijn er verschillende methodes om het op te sporen:

  1. DeepCrawl
  2. Http status code checker
  3. Copyscape
  4. Siteliner
  5. Google Search Console

1. DeepCrawl

DeepCrawl is een tool om een uitgebreide technische check van je website te doen, en kan ook duplicate content opsporen. Je kunt vervolgen zien welke pagina’s als eerste aangepakt moeten worden. Het mooie van deze tool is dat het niet alleen de technische kant ziet, maar ook de inhoud meepakt.

2. Http status code checker

Met httpstatus.io ontdek je snel of er duplicate content is door variaties in je URL. Je vult alle varianten van de URL die je wilt checken in, en in het resultaat zie je de bijbehorende statuscodes. Als alles goed is, zie je 1 URL met 200 als code, de rest moet een code 301 laten zien. Dit betekent dat al het verkeer van de varianten worden doorgestuurd naar de standaard URL.

3. Copyscape

Met Copyscape zie je of iemand anders de content op jouw website hergebruikt. Vul de URL van je pagina in, en de tool checkt of dezelfde content ergens anders wordt aangeboden.

Duplicate content in Copyscape
Rood gearceerd komt overeen met de content op jouw pagina.

4. Siteliner

Siteliner is een simpele tool om duplicate content op te sporen. Wat erg prettig is, is dat je een voorbeeld van je pagina ziet waarop alle duplicate content is gearceerd. Het is wel belangrijk hier nog even goed naar te kijken, want Siteliner is soms wat ongenuanceerd. Zo kan het zijn dat je contactformulier, dat op meerdere pagina’s staat, als duplicate content aangemerkt wordt.

5. Google Search Console

Of Google jouw content als duplicate content ziet, ontdek je in Google Search Console. Na het inloggen klik je op ‘Dekking’, vervolgens op ‘Uitgesloten’. Hier zie je of er pagina’s niet zijn geïndexeerd en wat de reden daarvan is. Soms is dat duplicate content.

Duplicate-content-checken-Search-Console
Dubbele pagina’s die niet geïndexeerd zijn, staan in Google Search Console.

Duplicate content oplossen

Nu je weet welke soorten duplicate content er zijn en hoe je ze kunt vinden, wil je natuurlijk weten hoe je het probleem van duplicate content oplost. Dat verschilt per soort, laten we daar eerst nog even naar kijken:

  • Varianten in URL die zorgen voor meerdere pagina’s met exact dezelfde inhoud
  • Te kleine verschillen in de pagina’s
  • Dezelfde inhoud op verschillende websites

Variaties in URL oplossen

Duplicate content die door technische instellingen ontstaat, los je op met een zogenaamde 301-redirect of de canonical tag. Welke oplossing het meest geschikt is, hangt af van de instelling die de duplicate content veroorzaakt.

301-redirect

Variaties in je URL’s komen vaak voor, maar er is altijd 1 standaard URL. Met de 301-redirect laat je aan Google zien welke URL dat is. Komt Google een duplicate pagina tegen met een 301, dan laat hij de standaard URL aan je bezoeker zien. De meeste linkwaarde gaat er ook naartoe. Wij hebben deze 301-redirects ingesteld:

  • van http naar https
  • met www naar zonder www
  • zonder ‘/’ op het eind naar met ‘/’
voorbeeld-301-redirect-path

Gebruiken we expres een URL die niet standaard is, dan zie je dankzij Ayima direct wat er gebeurt. Ayima is een handige extensie voor Google Chrome om redirects te checken. Je kunt voor bijna alle uitzonderingen een 301-redirect instellen. Overleg met je webbouwer of dit standaard ingericht kan worden, zodat je niet bij elke nieuwe pagina handmatig allerlei redirects moet instellen. Let ook op je interne linkstructuur, zodat je niet naar een URL met ‘www’ verwijst als dat niet de standaard is.

Canonical tag

Als je filters, trackingcodes of paginering op je webpagina’s gebruikt, dan zorgen de bijbehorende parameters voor heel veel URL’s en zorgen. Je herkent de parameter aan de ‘?’ in jouw URL. Daarachter staat een stuk code. Met de canonical tag laat je aan Google zien dat de pagina met parameters een kopie is van de originele pagina.

Canonical tag bij parameters

De URL zonder parameters zet je in de ‘<head>’ van je pagina, waarbij je verwijst naar het deel voor het vraagteken. Bijvoorbeeld zo:

‘<link rel=”canonical” href=”https://www.sportswearonline.nl/schaatsen/dames/schaatsjacks/>’

Filter ik vervolgens op een jack dat geschikt is voor schaatsen bij hele lage temperaturen, dan ziet de URL er zo uit:

https://www.sportswearonline.nl/schaatsen/dames/sc...&max=150&min=0&brand=0&filter%5B%5D=20847

Omdat je de originele URL in de header hebt staan, weten zoekmachines wat de originele pagina is.

Canonical tag bij productcategorieën

Je kunt de canonical tag ook gebruiken als een productpagina in een aantal categorieën terugkomt. In dit voorbeeld is het sportshirt ‘zoeff’ geschikt voor hardlopen, fietsen en fitness. Daarom zijn er 3 pagina’s voor hetzelfde shirt:

  • /hardlopen/zoeff/
  • /fietsen/zoeff/
  • /fitness/zoeff/

De linkwaarde van de productpagina is het meest waardevol voor de categorie ‘hardlopen’. Daarom plaatsen we onder ‘fietsen’ en ‘fitness’ deze canonical tag:

‘<link rel=”canonical” href=”https://onze-website/hardlopen/zoeff/>’

Te kleine verschillen in pagina’s

Heb je pagina’s die te veel op elkaar lijken, maar heb je ze wel allemaal nodig? Geen probleem, er zijn verschillende oplossingen.

Laat ze schrijven

Heb je veel vergelijkbare pagina’s nodig, dan kan het de moeite waard zijn om een aantal pagina’s door iemand anders te laten schrijven. Zelf zit je namelijk al snel vast in dezelfde formuleringen. Een copywriter of collega met ervaring kan er weer iets heel nieuws van maken.

Samenvoegen

Een andere optie is het samenvoegen van pagina’s met content die bijna identiek is. Geef je bijvoorbeeld een SEO-training op 2 verschillende dagen met 2 verschillende thema’s? Maak dan 1 pagina, waarbij je de verschillende thema’s in een eigen alinea beschrijft. Als je zo’n pagina hebt, verwijder ‘m dan nooit: hij behoudt z’n linkwaarde ook als je even geen trainingen geeft.

Gooi het in de mix

Misschien niet de beste, maar wel een hele praktische methode is het mixen van een aantal alinea’s. Stel dat je 100 pagina’s over jouw dienstverlening in plaatsen in de buurt wilt hebben. Je kunt dan 15 verschillende alinea’s schrijven en deze steeds anders combineren.

Gebruik deze methode nooit op zichzelf, dan is de kans groot dat het alsnog als duplicate content aangemerkt wordt. Kies daarom ook altijd 1 van de andere methodes.

Kies een andere invalshoek

Verkoop je producten die op elkaar lijken, maar wel een eigen pagina verdienen? Dan kun je de tekst nog vanuit een andere invalshoek schrijven. Speel met opsommingen, veelgestelde vragen en beschrijvingen om toch een unieke pagina te maken. Bijvoorbeeld zo, als je 2 soorten grasmaaiers verkoopt. Het enige verschil is het vermogen en dus de prijs.

Voor de Harry 1 kies je voor veelgestelde vragen, voor Harry 2 voor een beschrijving.

Variant 1 – veelgestelde vragen
> Hoeveel past er in de opvangbak?
De opvangbak van Harry 1 is 20 liter.

> Wat zijn de voordelen van deze grasmaaier?
Klein maar krachtig
Gras belandt direct in de opvangbak
Maaihoogte instelbaar
> Wat is de maximale gazongrootte?
Je maait met deze grasmaaier gazons tot ongeveer 100m2.

Variant 2 – beschrijving
De kleine maar stoere Harry 2 is een grasmaaier waar je u tegen zegt. Een gazon tot wel 100m2 is zo gemaaid, en het gras wordt opgevangen in de opvangbak van 20 liter. Nooit meer harken! Daarnaast is de maaihoogte in te stellen en past hij dankzij het compacte ontwerp in elke garage.

lawnmower

Dezelfde inhoud op verschillende websites

Is de tekst waar je zo hard aan hebt gewerkt ook op andere websites terechtgekomen? Dan kun je de volgende oplossingen gebruiken.

Plagiaat aanpakken

Heb je het idee dat iemand doelbewust je content heeft overgenomen? Dan kun je kiezen:

  • Je doet niks. Als Google jouw pagina al geindexeerd heeft, is de andere pagina duplicate content.
  • Vraag om een bronvermelding naar je website. Dat helpt direct mee bij het opbouwen van je linkprofiel!
  • Verwijs naar je auteursrechten en vraag om de content binnen 48 uur te verwijderen.
  • Zet juridische stappen als het echt niet anders kan. Win daarvoor altijd advies in bij een expert.

Wil je zelf een artikel delen op een extern platform? Dan kun je een canonical tag gebruiken om aan te geven wat je originele pagina is. Vraag de eigenaar van het platform om een link naar jouw website.

Aangeleverde productinformatie opfrissen

Veel webshops gebruiken de productinformatie van de fabrikant als beschrijving op hun website. Zo kan dezelfde beschrijving bij meerdere webshops terugkomen, waardoor er problemen met duplicate content kunnen ontstaan. Als het even kan, is het daarom slim om de aangeleverde productinformatie te herschrijven. Moet je verplicht de productinfo van de fabrikant gebruiken, vul de tekst dan aan met je eigen tekst. Door een concrete situatie voor het gebruik van het product te beschrijven, bijvoorbeeld. Een andere goede manier is om productreviews toe te voegen. Dit zorgt niet alleen voor unieke content op een productpagina, maar verbetert ook de conversie.

Stel dat je boeken verkoopt, dan ligt het voor de hand om de productinformatie, vaak een korte samenvatting, over te nemen van de uitgever. Je kunt daar content aan toevoegen die zowel een review bevat en een concrete situatie beschrijft:

Wat vindt onze leesclub?

‘Het laatste dagboek van Hendrik Groen’ is het perfecte boek voor een sombere winterdag. In je favoriete stoel met een lekkere kop thee zul je de pagina’s verslinden. Herkenbare situaties, boordevol humor en gevoelige momenten zorgen ervoor dat het derde deel uit de reeks niet onder doet voor deel 1 en 2. Het enige nadeel? Het is helaas het allerlaatste deel uit deze serie.

Nu ben jij aan de beurt!

Duplicate content is belangrijk genoeg om mee aan de slag te gaan. Het verbetert je positie in de zoekresultaten en de gebruikerservaring van je bezoekers. Je weet nu wat duplicate content is en hoe je het kunt oplossen. Heb je hulp nodig, klop dan even bij ons aan.

Deze blogpost is geschreven door Ineke Withaar is SEO Specialist bij Onder.nl

[Fotocredits heroimage © khalid_spk - Adobe Stock]
Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies