La balise canonique est une balise dans l’en-tête de votre HTML qui précise aux moteurs de recherche quel élément de contenu est l’original et quel élément est dupliqué. Elle a été créée dans le but d’éviter des problèmes de duplication de contenu et pour optimiser votre SEO.
En effet, certains éléments de contenu peuvent apparaître à de multiples endroits de votre site et peuvent ainsi être considérés comme du contenu dupliqué. Comme nous le savons déjà, le contenu dupliqué est pénalisé. La balise canonique fournit aux moteurs de recherche un moyen de savoir quelle version du contenu est l’originale, donne crédit à celle-ci, relie la copie à la bonne URL et affiche ainsi la bonne version dans les résultats des moteurs de recherche.

La mise en forme canonique est essentielle pour avoir un site internet bien optimisé et pour offrir une meilleure expérience utilisateur: ceux-ci n’ont pas à choisir la version de la page qui semble être la meilleure ou celle qui semble être l’originale.

Quand devriez-vous utiliser la balise canonique?

Il y a de nombreuses situations où le contenu dupliqué est pertinent et ne devrait ainsi pas être pénalisé:

  • Les URLs multiples: les sites e-commerce qui offrent une option de filtrage comme le prix, la taille, les couleurs ou des catégories ont beaucoup d’URLs avec du contenu dupliqué.
  • HTTP, HTTPS, WWW: un moteur de recherche peut considérer http://www.monsiteweb.com, http://monsiteweb.com et https://www.siteweb.com comme différents sites et les indexer en conséquence.
  • Les URLs mobile: les URLs sur mobile comme m.monsiteweb.com sont considérées comme du contenu dupliqué.
  • Les URLs selon le pays: le contenu reste semblable même si vous utilisez une URL spécifique à un pays. Cependant, si la langue est différente, il est judicieux de vouloir que les moteurs de recherche produisent des résultats séparés.
  • Les URLs d’identification de session, les liens de fils d’Ariane, les versions imprimables, les permaliens: ils sont générés automatiquement.

A vrai dire, ces exemples ne sont pas du contenu dupliqué pur mais plutôt des URLs générées par le système. Cela implique qu’il y a plusieurs URLs pour le même contenu donc la balise canonique doit être utilisée pour spécifier aux moteurs de recherche quel contenu est l’original et quelle URL doit être analysée, indexée et affichée dans leurs résultats.

A quoi devriez vous faire attention?

Premièrement, vous devez déterminer quelle URL constituera votre URL principale et ensuite insérer dans la section <header> de celle-ci:
<lien rel=”canonical” href=”http://www.votredomaine.com/votre-url-principale/” />

Beaucoup de CMS ont intégré cette balise et fournissent des solutions pour la mettre en place. Dans le cas contraire, les moteurs de recherche offrent un recours sélectif aux redirections 301 (si votre site affiche le même contenu à la fois sur http, https et www), à des paramètres spécifiques pour les URLs avec Google Webmaster Tools et aux en-têtes HTTP en utilisant PHP ou .htaccess.

Ainsi, il y a plusieurs règles à respecter si vous voulez que votre balise canonique fonctionne bien:

  • Vérifiez que la cible de la balise canonique existe ou vous obtiendrez une erreur 404
  • Vérifiez que la cible de la balise canonique n’a pas de balise meta “noindex robots”
  • Insérez le lien de la balise canonique soit dans le <head> de votre page ou dans celle de l’HTTP et non dans le <body>
  • N’incluez pas plus d’une balise canonique par page. S’il y en a plusieurs, elles seront toutes ignorées.
  • Une grosse partie du contenu dupliqué de la page devrait être aussi dans la version canonique

Si vous avez besoin de plus d’informations sur le sujet, regardez cette vidéo. Matt Cutts de Google y explique les éléments du lien canonique en détail:

Pour vérifier vos liens canoniques, vous pouvez également utiliser OnCrawl. En effet, notre outil vous affichera une vue précise de vos performances canoniques: si elles correspondent ou non ou simplement si elles ne sont pas mises en place.

Balise canonique

En ensuite, lorsque vous cliquez sur un segment spécifique, vous pouvez accèder à tous les détails de l’URL.

 

seo crawler oncrawl