Hreflang-What-it-is,-how-to-optimize-it-and-what-mistakes-to-avoid-250px

Hreflang : ce que c’est, comment l’optimiser et les erreurs à éviter

2 janvier 2024 - 16  min de lecture - par Rebecca Berbel
Accueil > SEO Thoughts > Hreflang : ce que c'est et comment l'optimiser

Toute stratégie SEO à envergure internationale devrait s’appuyer sur la balise hreflang, car elle permet de cibler plus précisément le public international souhaité.

Cependant, le hreflang html s’avère être un sujet sensible pour certains SEOs, parce qu’il peut être difficile d’utiliser des balises et de les mettre en œuvre correctement sur des sites géo-ciblés. Examinons de plus près ce qu’il faut savoir pour mettre en œuvre hreflang, l’optimiser et les erreurs à éviter.

Qu’est-ce que hreflang et comment cela fonctionne-t-il ?

Avant de comprendre comment cela fonctionne, il faut s’assurer que nous sommes tous sur la même longueur d’onde en ce qui concerne la définition de hreflang. Pour faire simple, hreflang est un attribut HTML qui aide Google à décider quelle page doit être affichée et à qui elle doit l’être.

La balise hreflang ont pour objectif de croiser des pages qui sont similaires au niveau du contenu, mais qui ciblent différents publics selon leur langue et / ou leur pays. Elles s’assurent que le bon contenu et que les bonnes pages soient affichés aux bons utilisateurs lorsqu’ils chercheront la version de la recherche Google que vous ciblez.

L’exemple ci-dessous montre deux codes html qui s’adressent aux francophones en France et aux francophones au Canada :

<link rel=”alternate” hreflang=”fr-fr” href=”http://www.example.com/fr/” />

<link rel=”alternate” hreflang=”fr-ca” href=”http://www.example.com/fr-ca/” />

Ces deux balises apparaîtront sur les deux pages. Ceci permettra donc aux Canadiens qui cherchent dans google.ca de trouver la page les ciblant spécifiquement ainsi que les Français qui recherchent dans google.fr de trouver la page les correspondant au mieux.

Pourquoi hreflang est-il important pour le SEO ?

Les balises hreflang permettent d’envoyer un signal fort à Google pour lui indiquer qu’une page est une traduction ou une localisation d’une autre, ce qui contribue à son tour à stimuler le positionnement des nouvelles traductions.

Les balises hreflang sont un élément clé d’un site web internationalisé et donc de votre SEO international. Elles peuvent également être utiles pour partager les signaux de qualité, de pertinence et d’autorité entre les différentes versions linguistiques de votre site.

[Ebook] Le SEO international : Volet 1

Découvrez un guide détaillé en deux volumes pour élaborer et mettre en œuvre une stratégie de SEO à l'international.

Comment construire une balise hreflang : 3 méthodes

Maintenant que nous savons de quoi il s’agit, voyons comment le configurer. La configuration de votre hreflang nécessite le code de la langue et du pays et doit référencer toutes les pages qui servent d’alternatives. Vous pouvez consulter notre e-book qui vous guidera tout au long du processus.

Il existe trois façons d’implémenter vos balises hreflang que nous allons détailler ci-dessous.

Lors d’un crawl avec l’application Oncrawl, nous pouvons collecter et analyser les déclarations hreflang qui indiquent aux moteurs de recherche dans quelle langue la page est rédigée et quelles sont les autres langues disponibles.

1. Déclarations HTML hreflang dans la page <head>

Tout comme les tags canonical, les étiquettes hreflang prennent la forme suivante :

hreflang code option 1

2. Déclarations de Hreflang dans les en-têtes HTTP de la page

Cette méthode est particulièrement utile si votre page est un fichier dans un format autre que HTML, comme une image ou un PDF.

Ces déclarations ressemblent à ceci :

hreflang code option 2

3. Déclarations de Hreflang dans les sitemaps

En déclarant les références hreflang dans les sitemaps, vous pouvez conserver toutes vos références à un seul endroit. Toutefois, cela signifie également que vous devez tenir vos sitemaps à jour lorsque vous ajoutez des traductions ou des localisations.

Les déclarations de sitemaps ajoutent une balise <xhtml:link> et ses propriétés à la liste pour chaque page avec des traductions hreflang :

hreflang code option 3

Si vous utilisez cette méthode pour vos déclarations hreflang, vous pouvez cocher l’option suivante dans vos paramètres de crawl :

Étendez la section Sitemap des paramètres de crawl.

Sitemaps Oncrawl app

Cochez la case Allow soft mode.

Cela garantit que nous analyserons les sitemaps, que vous suiviez ou non les règles du protocole des sitemaps. De nombreux sites ignorent ces règles en ce qui concerne l’endroit où ils placent les sitemaps. De cette façon, vous n’avez pas besoin de spécifier les URLs de sitemap.

Optimisation de l’utilisation de hreflang

Les balises hreflang, quelle que soit la méthode que vous choisissez pour les mettre en œuvre, ont des éléments systématiques et importants à respecter. Sinon, vous risquez qu’elles soient ignorées par les moteurs de recherche et, pire encore, que votre public cible ne puisse pas les trouver.

Préparez son crawl pour l’analyse de hreflang

Les données Hreflang sont automatiquement incluses dans chaque crawl. Vous n’avez rien de spécial à faire.

Si votre site est traduit ou localisé et que vous souhaitez analyser des données complètes sur les hreflang, la seule chose que vous devez faire est de vous assurer que toutes les pages du site sont explorées, quelle que soit leur langue.

Supposons que votre site comporte des traductions dans différents répertoires, tels que https://www.yoursite.com/es et https://www.yoursite.com/en:

  • S’il existe des liens entre votre URL de départ et chaque répertoire, vous n’avez rien d’autre à faire.
  • Si vous n’êtes pas sûr, il serait peut-être utile de lister tous les répertoires en tant qu’URL de départ. Vous pouvez le faire dans la section Start URL des paramètres de crawl.

 

Toutefois, si votre site comporte des traductions dans différents sous-domaines, tels que https://es.yoursite.com et https://en.yoursite.com, vous devez tenir compte des éléments suivants :

  • S’il existe des liens entre votre URL de départ et chaque sous-domaine, descendez jusqu’à la section Subdomains dans les paramètres d’exploration et cochez la case Crawl encountered subdomains. Voilà, c’est fait !
  • Si vous n’êtes pas sûr, vous pouvez lister tous les sous-répertoires linguistiques ou régionaux comme URL de départ. Vous pouvez le faire dans la section Start URL des paramètres de crawl. Si vous indiquez toutes vos URLs de traduction comme URL de départ, vous n’avez pas besoin d’activer l’option crawl encountered subdomains, sauf si vous souhaitez explorer d’autres sous-domaines pendant le crawl.

 

Enfin, examinons le scénario dans lequel votre site comporte des traductions sur différents domaines, tels que https://www.mysite.es et https://www.mysite.co.uk.

  • Dans la section Start URL des paramètres de crawl, vous devez répertorier tous les domaines en tant qu’URL de départ. C’est la seule façon d’obtenir les données de hreflang de votre site pour les deux domaines à la fois.

Les données hreflang disponibles

Comme pour toutes nos données, vous pouvez cliquer sur l’explorateur de données pour afficher les URLs des hreflang, les langues, les questions spécifiques et les groupes de pages pour chaque URL.

Available hreflang data

Des colonnes supplémentaires peuvent également être ajoutées aux résultats de Data Explorer :

  • Hreflang hrefs : une liste de toutes les URLs référencées dans les liens hreflang de la page.
  • Hreflang langs : une liste (dans le même ordre que les hreflang hrefs) de toutes les langues référencées dans les liens hreflang de la page.
  • Hreflang errors : une liste de toutes les erreurs (s’il y en a) trouvées pour la page.
  • Détails des erreurs hreflang : un lien vers un aperçu de l’utilisation des hreflang pour la page, y compris un lien vers le filtre Oncrawl Query Language pour le groupe de pages, et les détails des erreurs pour chaque erreur rencontrée.
  • Hreflang cluster ID : un ID Oncrawl qui identifie de manière unique chaque groupe de pages qui se réfèrent les unes aux autres comme des traductions hreflang.
  • Hreflang source : une liste (dans le même ordre que les hreflang hrefs) de l’endroit où l’application a trouvé la référence hreflang. La source d’une déclaration hreflang dans cette liste peut être HTML , Header ou l’URL d’un sitemap.

Les clusters de pages hreflang

Sur chaque page, les déclarations de hreflang énumèrent toutes les pages équivalentes pour d’autres langues ou régions. Ensemble, ces pages forment un groupe.

Lorsque les hreflangs sont correctement appliquées, chaque page d’un groupe aura une référence hreflang à toutes les autres pages du groupe, y compris une référence à elle-même. Voici un exemple de groupe idéal simplifié :

Perfect hreflang cluster

Toutes les pages référencées comme hreflangs doivent être des pages canoniques et indexables.

Cependant, il arrive souvent que certains liens au sein d’un groupe soient manquants ou incorrects, ce qui produit des groupes avec des erreurs :

hreflang cluster with missing links

Identifiez et explorez les clusters de pages hreflang dans Oncrawl

Il est relativement simple d’identifier et d’explorer les clusters de pages hreflang à l’aide de l’Oncrawl Data Explorer.

Chaque cluster se voit attribuer un identifiant unique et pour afficher les pages du cluster pour une URL spécifique, vous pouvez utiliser le raccourci suivant pour le filtre de langage Oncrawl Query :

Finding hreflang data in Oncrawl

Vous pouvez facilement vérifier si vous avez ajouté les bonnes alternatives linguistiques sur toutes les pages nécessaires.

Pages with hreflang

Détectez les problèmes liés à hreflang

Il y a deux chartes principales dans l’application que nous recommandons de regarder pour identifier les problèmes hreflang sur votre site : la charte des problèmes hreflang et la charte des pages non indexables déclarées en tant que hreflang.

Les deux se trouvent dans le tableau de bord par défaut sous Crawl report > Indexability > Relate alternate.

Identifying hreflang issues

Certains problèmes peuvent empêcher Google de prendre en compte vos déclarations hreflang :

Déclarations manquantes

  • Déclarations sortantes manquantes : cette page contient les déclarations manquantes pour certaines pages du groupe.
  • Déclarations entrantes manquantes : certaines pages du groupe ne déclarent pas cette page.

[Ebook] Le SEO international : Volet 2

Découvrez le deuxième volet de notre ebook sur le SEO international qui aborde les erreurs courantes à éviter.

Auto-déclaration manquante

  • Cette page ne se déclare pas comme alternative.

 

Les déclarations hreflang en double

  • Plusieurs hreflangs pour une même langue : cette page déclare plusieurs hreflangs pour la même langue.
  • Même hreflang pour plusieurs langues : cette page déclare une hreflang plusieurs fois, et pour plusieurs langues.
  • Hreflang situé à plusieurs endroits : cette page déclare une hreflang plusieurs fois, et à plusieurs endroits (sitemaps, en-tête, html).
  • La page est hreflang pour plusieurs langues : cette page est déclarée comme alternative par les autres pages pour plusieurs langues.
  • Double déclaration hreflang : cette page permet de déclarer une hreflang plusieurs fois, pour la même langue.

 

Déclarations contradictoires de x-default

  • Cette page déclare une URL x-default qui n’est pas la même que l’URL x-default déclarée par au moins une autre page du groupe.

 

Code de langue erroné

  • Cette page déclare un hreflang avec un code de langue incorrect.

 

Pages non indexables déclarées comme hreflang

  • Les annotations hreflang avec un mauvais status code : la page fait partie d’un cluster contenant des pages avec un statut 5xx ou qui n’ont pas répondu.
  • 3xx hreflang : cette page fait partie d’un groupe contenant des pages avec un statut 3XX.
  • 4xx hreflang : cette page fait partie d’un groupe contenant des pages avec un statut 4XX.
  • Hreflang non indexable par les méta-robots : cette page fait partie d’un groupe contenant des pages non indexables par des méta-robots.
  • Hreflang non indexable par robots.txt : cette page fait partie d’un groupe contenant des pages non indexables par robots.txt.
  • Hreflang non canonique : cette page fait partie d’un ensemble de pages non canoniques.
  • Page non indexable : cette page n’est pas indexable, mais fait partie d’un groupe de hreflang.

Les meilleurs conseils pour implémenter hreflang

In order to prevent Google from treating your translations as duplicate content, it is especially important to indicate translations of pages when content may look very similar to a search engine. This may be the case in the following examples:

When using hreflang tags, here are some top tips to help you optimize your pages.

Afin d’éviter que Google ne traite vos traductions comme du contenu dupliqué, il est particulièrement important d’indiquer les traductions de pages dont le contenu peut ressembler beaucoup à celui d’un moteur de recherche. Cela peut être le cas dans les exemples suivants :

  • Contenu créé par l’utilisateur : par exemple, forums, commentaires ou critiques de produits.
  • Des variantes régionales : par exemple, une page en anglais sud-africain et une page en anglais américain.
  • Les traductions de sections entières ou de sites entiers.

Lorsque vous utilisez les balises hreflang, voici quelques bonnes pratiques pour optimiser vos pages ainsi que quelques erreurs à éviter.

Veillez à ce que les liens soient réciproques

Un problème avec les liens réciproques signifie que les annotations hreflang ne se réfèrent pas l’une à l’autre. Vous pouvez voir ces erreurs dans votre Google Search Console sous l’onglet « International Targeting » (Ciblage international).

Une règle essentielle à garder en tête est que vos annotations doivent être confirmées par les autres pages. Par exemple, si la page A renvoie à la page B, la page B doit renvoyer à la page A pour éviter tout problème de compréhension de la part des moteurs de recherche. La page A doit utiliser l’annotation rel-alternate-hreflang qui renvoie à elle-même pour fonctionner correctement. Les liens non réciproques sont ignorés par Google.

Utilisez le bon format d’URL

Indiquez l’URL dans le format correct : « https://www.yoursite.com/your_page« . Attention à ne pas oublier le « https:// » !

L’option hreflang= »x-default » est une possibilité

Utilisez la valeur facultative hreflang= »x-default » pour les pages de sélection de la langue ou pour les pages qui redirigent automatiquement vers la langue de l’utilisateur.

Créez une page de langue générique

Indiquez une page de langue générique, telle que « en », si vous avez une série de pages régionales dans cette langue (« en-US », « en-GB », « en-CA », « en-ZA », « en-AU »). Cette page sera utilisée pour toutes les régions que vous n’avez pas spécifiées. Dans cet exemple, cela pourrait inclure la Nouvelle-Zélande anglophone, ou même un utilisateur naviguant en anglais depuis la France.

Utilisez le code correct pour la langue et la région

L’utilisation de hreflang implique le ciblage du bon pays ou de la bonne langue. Veillez donc à ajouter les bons codes à vos pages web. Google explique que,

« La valeur de l’attribut hreflang doit être au format ISO 639-1 pour la langue et au format ISO 3166-1 Alpha 2 pour la région. La spécification de la région uniquement n’est pas supportée. »

Certaines études montrent que Google reconnaît certaines erreurs et les corrige ; d’autres montrent le contraire. Il est plus facile de faire preuve de prudence et d’utiliser les codes corrects.

Si la langue ciblée utilise plusieurs scripts, vous pouvez également choisir de spécifier le script. Par exemple, pour indiquer une page en chinois simplifié pour les utilisateurs de Taïwan, vous pouvez utiliser le code zh-Hans-TW.

Jusqu’à récemment, Google vous demandait de lister toutes les traductions disponibles d’une page. Cette pratique est toujours fortement encouragée. Cependant, si vous ne pouvez pas lister toutes les traductions de la page, vous devez inclure des liens réciproques rel= »alternate » entre chaque page traduite et la page dans la langue principale ou originale de votre site.

Évitez d’ajouter des balises hreflang aux pages non indexées

Google signale les balises hreflang comme une erreur si elles pointent vers des pages non indexées, qu’elles soient accompagnées d’une balise meta-robots noindex ou bloquées dans le fichier robots.txt

Google ne pourra pas suivre le lien de retour de cette page bloquée vers le lien d’origine, et signalera donc une erreur de balise de retour. Veuillez noter que seules les pages bloquées cesseront de fonctionner, et non toutes les balises hreflang d’un groupe de pages.

Choisissez la technique que vous souhaitez utiliser : ne mélangez pas les méthodes de balisage des pages et les méthodes de sitemap hreflang

Il est contre-productif de combiner les méthodes pour mettre en œuvre le hreflang. Voici quelques informations à garder à l’esprit lorsque vous décidez d’utiliser les sitemaps xml ou les méthodes de balisage des pages :

  • Les CMS comme WordPress offrent des solutions automatiques de marquage de page multilingue.
  • Les sitemaps xml Hreflang peuvent être difficiles à créer. Vous pouvez utiliser des outils en ligne ou les créer dans Excel, mais il est difficile d’automatiser le processus. Si vous avez des sitemaps xml que votre CMS actualise automatiquement, il serait préférable de continuer à utiliser ceux-ci plutôt que de créer des sitemaps séparés (hreflang xml statiques) ;
  • Le marquage de page crée beaucoup de codes, en particulier pour des ciblages pays / langues multiples. On peut ajouter 10 lignes de codes supplémentaires à chaque page géociblée.

N’utilisez pas hreflang pour tenter de résoudre les problèmes de contenu dupliqué

Certains mythes SEO prétendent que la mise en œuvre des balises hreflang résoudrait les problèmes de contenu dupliqué. En fait, pour des contenus similaires, ajouter des balises hreflang à votre site aidera Google à reconnaître et à comprendre l’objectif de votre page au niveau du pays et de la langue, mais cela n’aidera pas les moteurs de recherche à déterminer quelle version d’un contenu est la meilleure pour telle ou telle requête.

Disons que vous avez deux pages dans la même langue qui cible différentes zones comme les Français en France et les Français de la Belgique. Le contenu de ces deux pages peut être si semblable qu’il sera perçu comme du contenu dupliqué ; l’ajout de balises hreflang n’y suffira pas.

Il est possible que votre page française surclasse votre page belge si la page française à plus de liens de qualité et surtout si elle a des liens d’autres sites français qui pointent vers elle.

Le SEO multilingue aide Google à comprendre votre contenu, mais pour avoir une stratégie de marketing internationale efficace, vous devez aussi inclure du link building sur vos sites à partir de pays / langue que vous ciblez pour tirer parti de vos différentes versions internationales.

Le contenu dupliqué est un problème important, mais distinct, qui doit être traité séparément.

Conclusion

En résumé, la maîtrise de l’implémentation des balises hreflang est un aspect crucial de toute stratégie de SEO internationale et Oncrawl est un allié de taille pour les SEO travaillant sur des sites internationaux, car il vous donne une vision précise de l’état de votre implémentation des balises hreflang.

La construction des balises hreflang peut sembler compliquée, mais qu’il s’agisse de déclarations HTML, d’en-têtes HTTP ou de sitemaps, l’objectif reste le même : signaler avec précision les relations entre les pages ciblant des langues et des régions différentes.

Bien qu’il s’agisse d’un outil important et puissant, les balises hreflang ne sont pas la solution miracle au référencement international. Une stratégie holistique de marketing international est impérative pour un succès durable.

Alors que vous naviguez dans le paysage numérique multilingue et multiculturel, laissez hreflang être votre boussole, en guidant les utilisateurs de manière transparente vers le contenu qu’ils recherchent, indépendamment des frontières ou des langues.

Rebecca Berbel Voir tous ses articles
Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :