Een canonical URL is de originele pagina waar andere pagina’s op gebaseerd zijn. Dit kunnen identieke pagina’s zijn op een ander adres of aangepaste pagina’s voor een andere doelgroep. Wat is een canonical URL en wanneer moet je ze toepassen?
Bij optimalisatie voor zoekmachines is het van belang dat de pagina’s origineel zijn. Dit betekent dat de content niet zomaar van andere bronnen gekopieerd mag worden en dat je niet steeds opnieuw dezelfde pagina’s op nieuwe adressen publiceert. Voor een deel is dit van belang om een persoon die naar informatie zoekt steeds dezelfde content voor te schotelen, anderzijds is het een manier om schending van gebruiksrechten te voorkomen. Door een canonical URL te bepalen geef je aan wat de originele pagina is.
De canonical URL is een HTML element met het attribuut rel=“canonical”. Dit attribuut wordt opgenomen in het <head> element van de pagina. Deze specificatie werd vastgelegd in april 2012 en wordt beschreven in RFC 6596. Het kan voorkomen dat hackers naast content ook de canonical URL kunnen bemachtigen waardoor het origineel als kopie wordt aangemerkt.
Als je meerdere webshops hebt met andere branding maar hetzelfde assortiment dan wil je niet voor iedere winkel steeds opnieuw beschrijvingen maken. Om te voorkomen dat het algoritme dit ziet als onrechtmatige kopieën is het mogelijk om een canonical URL aan te wijzen. Media outlets maken hier ook gebruik van. Zo kunnen lokale nieuwssites naast lokaal nieuws ook algemeen nieuwswaardige artikelen publiceren. Het is dan aan te bevelen om een pagina als canonical URL aan te duiden.
Een canonical URL kan een alternatief zijn voor een 301 redirect maar als het mogelijk is dan is het gebruik van een 301 redirect een betere optie. Als er gebruik wordt gemaakt van de canonical URL tag dan is het niet nodig om soortgelijke pagina’s te voorzien van een robot.txt. Dit zou de pagina uitsluiten van de zoekindex wat negatieve gevolgen kan hebben voor de oorspronkelijke pagina.