Er is sprake van dubbele inhoud (Duplicate Content in het Engels) als twee of meer pagina’s (vrijwel) dezelfde inhoud hebben. Dubbele inhoud komt op veel websites voor, omdat eenzelfde pagina vaak met verschillende URL’s is op te vragen.
Dubbele inhoud vertraagt het crawlen van je site. Vooral bij hele grote websites kan dit de indexatie van je website negatief beïnvloeden. Ook kan Google het belang van een pagina onderschatten als Google kopieën van een pagina als aparte pagina beschouwt, terwijl het eigenlijk dezelfde pagina is.
Als Google pagina’s met dezelfde inhoud tegenkomt, beschouwt het één versie als het origineel en de rest als kopie. Het origineel toont Google in de zoekresultaten; de kopieën worden niet getoond. Als je teksten kopieert van andere sites toont Google jouw pagina mogelijk helemaal niet als zoekresultaat.
Dubbele inhoud kan op allerlei manieren ontstaan, bijvoorbeeld:
- de site maakt gebruik van facetnavigatie (filters).
- een pagina is op te vragen met of zonder / (/pagina en /pagina/).
- een pagina is op te vragen met of zonder www (www.voorbeeld.nl en voorbeeld.nl).
- een pagina heeft ook een printvriendelijke versie.
Dubbele inhoud oplossen
Er zijn diverse manieren om Google duidelijk te maken dat verschillende versies van een pagina eigenlijk één pagina betreffen:
- Met een redirect zorg je dat verschillende versies van een pagina naar één URL verwijzen. Er blijft dan maar één versie over.
- Met een canonical link element in alle versies van een pagina geef je aan welke versie de belangrijkste is. Er blijven verschillende versies bestaan, maar Google weet wat de hoofdversie is.
- Via Google Search Console vertel je Google wat de betekenis is van de URL parameters in je site. Google weet dan welke parameters het kan negeren.
- Door de hoofdversie van een pagina in de XML sitemap op te nemen, geef je Google een hint wat jij als de belangrijkste versie ziet.