Internet est rempli de contenus dupliqués. Parfois, le contenu est délibérément modifié dans le but de tromper les algorithmes des moteurs de recherche afin d’améliorer le classement du site. Ces pratiques engendrent une mauvaise expérience utilisateur (UX), poussant les moteurs de recherche comme Google à pénaliser ces sites web.
Parmi cette multitude de contenus dupliqués, les crawlers peuvent manquer les contenus originaux, ce qui influe directement sur le classement du site. Même si le contenu de la page web se classe, les crawlers peuvent choisir la mauvaise URL à défaut de celle d’origine. Le contenu dupliqué devient donc à l’origine de nombreux problèmes de référencement.
Mais Google traite le contenu dupliqué différemment du contenu copié ou “trompeur”.
La plupart des contenus dupliqués sont produits accidentellement ou dûs à une mauvaise implémentation technique. Par exemple, si votre site est disponible en HTTP et HTTPS en même temps, cela peut accidentellement induire Google en erreur. La canonicalisation répond à ces problèmes de référencement, permettant de contrôler le contenu dupliqué sur vos pages web.
Rentrons maintenant dans le vif du sujet, essayons de comprendre le fonctionnement les balises canonique et comment améliorer notre référencement grâce à elles !
Que sont les URLs canoniques ?
L’objectif premier de Google est d’offrir le contenu le plus pertinent à ses utilisateurs. De plus, la multinationale s’efforce d’accorder un maximum de crédit aux créateurs de contenu original. L’algorithme de Google est conçu pour pénaliser les sites qui volent du contenu ou qui n’en affichent pas. Donc, si votre site dispose de pages différentes avec un contenu identique ou si une seule page est accessible via plusieurs URLs, Google peut la traiter comme un doublon.
Par exemple, jetez un coup d’œil à ces URLs. Elles pointent toutes vers la page d’accueil du site, “customized coffee mugs” mais chaque URL est quelque peu différente. Ceci peut s’avérer confus pour les moteurs de recherche, les amenant à choisir n’importe quelle URL de manière algorithmique et à crawler cette page. Les autres URLs seront alors vues comme une page avec un contenu dupliqué.
Il est essentiel de spécifier l’URL que vous voulez que le moteur de recherche considère comme originale.
Une balise canonique (balises de lien HTML avec l’attribut rel= »canonical ») aide les webmasters à consolider le contenu dupliqué. Celle-ci indique aux moteurs de recherche que le contenu d’une URL est authentique, réduisant ainsi le risque d’être pénalisé pour le “duplicate content” ou l’auto-plagiat. Si vous avez des pages identiques pour les versions mobiles et desktop, et que vous n’indiquez pas au moteur de recherche quelle URL est canonique, les crawlers choisiront la version canonique pour la classer.
Il est sage d’utiliser la canonicalisation pour indiquer aux moteurs de recherche votre URL de référence, les informant d’indexer cette page spécifique ainsi que d’améliorer le classement de votre site.
Dans cette vidéo, John Mueller explique comment Google utilise une URL canonique afin de la distinguer des doublons.
[Étude de cas] Gérer le crawl du robot de Google
Quand utiliser la canonicalisation ?
Puisque les balises canoniques spécifient la version » préférée » d’une page web aux moteurs de recherche, elles aident les webmasters à éviter la duplication de contenus afin d’améliorer le classement d’un site. Il est donc important d’utiliser des balises canoniques dans le cas : d’URLs multiples, d’URLs alternatives, d’URLs spécifiques au mobile (pages AMP), de permaliens ou encore d’URLs spécifiques au lieu.
Maintenant, voici quelques exemples où les webmasters peuvent utiliser la canonicalisation pour guider les moteurs de recherche et améliorer leurs chances d’être mieux classés.
- Blogs et sites web affichant d’anciens contenus
Si votre site offre un contenu permanent ou fait partie d’une franchise, vous devriez peut-être publier d’anciens articles ou partager du contenu mis en ligne sur le site web principal. Il convient alors d’ajouter une balise canonique à ces mêmes contenus afin de diriger les crawlers vers le site d’origine. Cela indiquera au moteur de recherche que vous ne faites pas que copier le contenu et vous protégera d’éventuelles sanctions.
- Sites E-Commerce utilisant plusieurs variantes d’URLs
Les sites E-commerce établissent souvent une hiérarchie d’URLs pour leur gamme de produits et les modifient souvent en fonction des besoins. Par exemple, un magasin de cosmétiques en ligne peut avoir une section spéciale pour le soin des lèvres et le diviser en rouge à lèvres, baumes pour les lèvres, hydratants etc.. Les URLs de ces pages changeront même si le contenu est le même, ce qui crée de la confusion. Les balises canoniques doivent être utilisées pour diriger les moteurs de recherche vers les pages préférées.
- La syndication
La syndication de contenu d’un blogs aide les spécialistes du marketing à accroître la notoriété de leur marque et offre un contenu de qualité aux sites d’édition. Cependant, comme le contenu syndiqué est réparti sur plusieurs sites web, il est difficile pour les moteurs de recherche de déterminer la source du contenu original. En déployant des balises canoniques, les webmasters peuvent facilement partager du contenu de haute qualité sans avoir à se soucier de leurs performances SEO.
La plupart des plateformes de publication de contenu réputées comme Medium utilisent la balise canonique pour donner de la valeur à leurs contributeurs.
- Pages web pour A/B Testing
La plupart des spécialistes du marketing numérique utilisent l’AB Testing pour évaluer l’accessibilité d’un site web. Ce faisant, les crawlers des moteurs de recherche peuvent parcourir deux pages, ce qui peut prêter à confusion. L’utilisation de balises canoniques peut aider dans certains cas.
● Duplication accidentelle de contenu sur votre site
Les balises canoniques peuvent être utilisées dans les situations suivantes lorsque du contenu dupliqué est créé involontairement.
● Le site web dispose de pages avec des versions HTTP et HTTPS ou www et non-www séparées.
● Un autre site web a scrappé et réutilisé votre contenu
● Vous avez utilisé les mêmes méta descriptions et titres pour plusieurs pages de votre site web.
● Votre site web rencontre des problèmes techniques de référencement tels que des problèmes de pagination ou a plusieurs versions de pages web imprimables et textuelles seulement.
[Étude de cas] Gérer le crawl du robot de Google
Comment définir une URL canonique pour votre site web ?
Pour commencer, vous pouvez consulter manuellement votre site pour noter les URLs qui semblent avoir un contenu identique, les images ou les titres. Utilisez l’outil Dupli Checker ou Siteliner pour signaler les contenus dupliqués sur votre site web.
L’outil Siteliner offre un résumé clair du contenu dupliqué sur le site web de Nykaa. Le site E-commerce de produits de beauté a 42% de contenu en double, comme la plupart des sites e-commerce.
Prenons un exemple similaire avec des mugs personnalisables. Supposons que vous ayez deux versions de la page du produit avec un contenu identique.
https://customizedcoffeemugs.com/gifts/personalizedgift/
https://customizedcoffeemugs.com/gifts/photogifts/
La seule chose qui est différente, c’est que ces pages sont dans des sections séparées de votre site web. Le contenu de ces URLs étant précieux, tous deux ont été reliés à plusieurs autres sites web.
Voici comment appliquer l’attribut ‘rel=canonique’.
- Sélectionnez l’une des URLs (que vous jugez importante) comme version canonique. Si vous n’arrivez pas à vous décider, choisissez celle qui a le plus de liens et de trafic.
- Ajoutez l’attribut ‘rel=canonical’ à toutes les pages qui ont un contenu identique et indiquez l’URL sélectionnée, comme ci-dessous. Généralement, cette balise est ajoutée directement au HTML dans la sectiondu site web. (Dans ce cas, ‘https://customizedcoffeemugs.com/gifts/photogifts/’ est l’URL que vous avez sélectionnée comme la plus importante.)
- Enfin, lors de l’inspection de l’URL dans la nouvelle search console de Google, les webmasters peuvent voir laquelle est sélectionnée par Google comme canonique. La page sélectionnée peut potentiellement être celle avec le balisage rel=canonical.
Utilisez le nouvel outil “Inspecter l’URL” permet de “Fetch as Google”, donnant la possibilité de sélectionner l’URL canonique de référence et de partager les informations, telles que les en-têtes HTTP et les ressources de page. Vous pouvez également demander qu’une URL canonique soit indexée par Google en cliquant sur l’onglet « Demander l’indexation » sur la page des résultats d’inspection.
Si votre site est hebergé par WordPress, des balises canoniques peuvent être ajoutées en utilisant des plugins. Par exemple, Yoast SEO offre une option pour ajouter l’URL canonique.
En résumé
L’utilisation de balises canoniques pour vos pages web est un excellent moyen de permettre aux moteurs de recherche de savoir d’où vient votre contenu et de déterminer son authenticité. Ainsi, la canonicalisation peut aider les webmasters à prouver que leur site web est digne de confiance et unique, améliorant ainsi leur classement en ligne.