Nouvelles métriques hreflang et clusters de pages disponibles

2 août 2018 - 12  min de lecture - par Rebecca Berbel
Accueil > Product update > Nouvelles métriques hreflang et clusters de pages disponibles

Nous avons le plaisir de vous présenter les métriques additionnelles d’OnCrawl pour les hreflang.

L’utilisation des balises hreflang permet à Google de présenter la bonne version régionale ou linguistique de votre page aux utilisateurs. Les balises hreflang envoient également un signal fort à Google qu’une page est une traduction ou une localisation d’une autre afin d’améliorer le référencement d’une nouvelle traduction et d’offrir du contenu approprié aux utilisateurs des moteurs de recherche selon leur langue ou leur pays. Les balises hreflang sont un élément clé pour un site web internationalisé.

Vous trouverez nos nouvelles métriques dans le tableau de bord « Rel alternate » de votre Crawl Report, dans le Data explorer, ainsi que dans le Dashboard Builder.

Hreflang metrics in the OnCrawl report

Données hreflang analysées par OnCrawl

Les déclarations hreflang pour les pages de votre site peuvent être indiquées de plusieurs façons différentes. Peu importe la méthode, une déclaration doit être réalisée pour chaque version localisée de la page, y compris pour la page originale.

Les pages traduites peuvent être déclarées :

  • par l’inclusion d’une balise <link> dans la section <head> de l’HTML de la page. Les balises prennent la forme suivante :

<link rel= »alternate » hreflang= »en-US » href= »https://www.yoursite.com/your_translated_page » />

  • par l’ajout d’une référence dans les headers HTTP de la page, surtout lorsqu’il s’agit d’un fichier dans un format autre qu’HTML. Les déclarations prennent la forme suivante :

Link: <https://www.yoursite.com/your_original_page>; rel= »alternate »; hreflang= »en-US », <https://www.yoursite.com/your_translated_page>

  • par l’ajout d’une référence dans les sitemaps. Les déclarations prennent la forme suivante :

<url>
<loc>https://www.yoursite.com/your_original_page</loc>
<xhtml:link
rel= »alternate »
hreflang= »en-US »
href= »https://www.yoursite.com/your_translated_page »/>
</url>

OnCrawl parcourt chaque page avec ces balises et analyse les résultats.

Clusters : des groupes de pages avec du contenu équivalent

Le but de lister des hreflangs est d’indiquer les pages qui contiennent du contenu équivalent ayant pour cible des utilisateurs qui parlent des langues différentes ou qui naviguent depuis des régions nationales différentes.

OnCrawl vous aide à rendre cette équivalence visible. Toutes les pages qui se référencent avec des déclarations hreflangs sont groupées dans le même cluster. Un cluster contient toutes les traductions (et, bien sûr, le contenu original) d’une page. Idéalement, chaque page du cluster devrait contenir des références à toutes les pages du cluster, y compris une référence à elle-même :

Ideal hreflang cluster

Afin de vous aider à résoudre d’éventuels problèmes, nous indiquons les erreurs de cluster les plus communes. Les erreurs qui reviennent souvent sont :

Hreflang cluster with missing links

Ce que nous vous signalons :

  • Des liens manquent dans ce cluster.
  • Page en italien (it) : cette page ne déclare pas un lien hreflang à elle-même.
  • Page en français pour les Français (fr-FR) : le lien entrant depuis la page belge n’est pas présent.
  • Page en français pour les Belges (fr-BE) : le lien sortant vers la page française n’est pas présent.

Hreflang cluster with missing links

Ce que nous vous signalons :

  • Des liens manquent dans ce cluster.
  • Page en italien (it) : cette page ne déclare pas un lien hreflang à elle-même.
  • Page en français pour les Français (fr-FR) : le lien entrant depuis la page belge, ainsi que le lien sortant vers le page en belge, ne sont pas présents.
  • Page en français pour les Belges (fr-BE) : le lien entrant depuis la page française, ainsi que le lien sortant vers la page française, ne sont pas présents.

Hreflang cluster with non-indexable page

Ce que nous vous signalons :

  • Des liens manquent dans ce cluster, et le cluster contient une page non indexable.
  • Page en italien (it) : cette page ne déclare pas un lien hreflang à elle-même.
  • Page en français pour les Français (fr-FR) : le lien entrant depuis la page belge, ainsi que le lien sortant vers le page en belge, ne sont pas présents.
  • Page en français pour les Belges (fr-BE) :cette page est non indexable mais fait partie d’un cluster hreflang. Le lien entrant depuis la page française, ainsi que le lien sortant vers la page française, ne sont pas présents.

Nous vous indiquons également la source de chaque traduction dans le cluster (headers HTTP, balises HTML ou l’adresse du sitemap) et nous vous avertissons si nous avons trouvé des clusters qui sont trop volumineux. (Cela arrive dans la plupart des cas lorsque beaucoup de pages listent la page d’accueil comme leur traduction.)

Utiliser OnCrawl pour améliorer votre internationalisation

Éviter que Google ignore vos déclarations hreflang

Des représentants de Google ont indiqué que, même si Google fait des efforts pour résoudre certaines erreurs hreflang de lui-même, il existe des erreurs qui font que Google ne prend pas en compte vos déclarations hreflang. Un exemple de ce type d’erreur est la déclaration hreflang d’une page non indexable.

Avec nos nouvelles métriques, vous pouvez trouver et corriger ces pages en seulement quelques clics :

  • Depuis le rapport de crawl, naviguez à « Indexability », puis au tableau de bord « Rel alternate ».
  • Parmi les premières statistiques, il y a « Non-indexable pages declared as hreflang ».
  • Cliquez sur le chiffre pour aller directement à la liste des pages concernées dans le Data Explorer.

Si vous avez besoin de plus d’informations, vous pouvez, pour chaque page, cliquer sur l’URL afin d’obtenir une analyse détaillée, ou bien ajouter des colonnes afin de visualiser les raisons pour lesquelles une page ne serait pas indexable, dont les colonnes suivantes :

  • Meta robots : refuser l’accès des bots dans les déclarations meta de l’HTML de la page empêchera l’indexation de la page.
  • Denied by robots.txt : refuser l’accès des bots dans le fichier robots.txt empêchera l’indexation de la page.
  • Canonical evaluation : une page non canonique, c’est-à-dire une page qui possède une déclaration canonique non correspondante, ne sera pas indexée.
  • Status code : les pages qui renvoient des codes statut 5xx, 4xx ou 3xx ne sont pas crawlées, et ne sont donc pas indexées.

Trouver toutes les pages dans la langue X avec un problème Y

Vous pouvez désormais utiliser OnCrawl afin de trouver toutes vos traductions qui utilisent un code langue non valide.

  • Depuis le rapport de crawl, naviguez à « Indexability », puis au tableau de bord « Rel alternate ».
  • Descendez jusqu’au graphique « Hreflang issues » vers le bas de la page.
  • Cliquez sur « Incorrect language code » afin de visualiser toutes ces pages dans le Data Explorer.

Mais il se peut qu’une vérification de base des codes langue et pays ne suffise pas. Pas de soucis : OnCrawl vous amène plus loin.

Par exemple : une erreur commune que nous avons constatée est l’utilisation du code langue et région « es-LA » pour l’espagnol d’Amérique Latine, même si LA est le code pays pour Laos.

Comme LA est un code pays valable, il est peu probable qu’il soit signalé comme une erreur dans vos rapports. Cependant, vous pouvez quand même rechercher « es-LA » et trouver toutes les pages qui l’utilisent :

Depuis le Data Explorer, utilisez le OnCrawl Query language pour établir la règle suivante :

Hreflangs – at least one value is – es-LA

hreflang filter for language code

Sauf si vous ciblez les hispanophones du Laos, si vos déclarations hreflang sont parfaitement établies, vous ne trouverez pas de résultat.

Trouver les pages en langue X sans traduction dans la langue Y

Nous pouvons vous aider à trouver les pages pour lesquelles vous n’avez pas encore de traduction.

Vous avez peut-être un site qui existe déjà en néerlandais et en français auquel vous avez commencé à ajouter des traductions vers l’allemand.

Utilisez l’OnCrawl Query Language dans le Data Explorer afin de trouver les pages qui ont déjà des versions néerlandaises et françaises, mais pas de version allemande. Indiquez les règles suivantes :

Hreflangs – has at least one value
AND
Hreflangs – none of the values equals – de

Hreflang search for missing language

Le résultat est une tableau qui montre les pages pour lesquelles vous n’avez pas encore (ou pour lesquelles vous ne déclarez pas encore) de traduction en allemand.

Ensuite, c’est à vous de jouer !

Crawler deux sites sur des domaines différents connectés par hreflang

OnCrawl gère les cas où chaque langue est implémentée sur son propre domaine, par exemple, https://www.mysite.co.uk et https://www.mysite.de.

Afin d’obtenir une analyse de l’implémentation des hreflangs, paramétrez votre crawl pour couvrir les deux domaines. Pour réaliser ce type de crawl, ajoutez les deux domaines en tant que « Start URL » dans les paramètres de crawl d’OnCrawl.

Depuis la page des paramètres du crawl, cliquez sur « Start URL » pour déplier la section. Dans le champ en dessous de l’instruction « You can define additional start URLs to your crawl », ajoutez les start URLs l pour toutes les langues additionnelles liées par hreflang.

Ensuite, démarrez votre crawl comme d’habitude.

Ceci ajoutera les données hreflang, ainsi que les données standards du crawl, pour chacun des domaines listés en tant que start URL.

Obtenez une vue globale de votre internationalisation

Est-ce que vous trouvez que ces exemples sont trop détaillés ? Vous souhaitez simplement obtenir une vision globale de ce qui se passe avec les hreflangs sur votre site ?

Ou êtes-vous un gourou des hreflangs et vous souhaitez vérifier de temps en temps que tout est toujours en parfait état de fonctionnement ?

Il vous suffira de jeter un oeil rapide à nos graphiques (ou de les ajouter à votre Custom Dashboard, si c’est plus facile pour vous).

Hreflang metrics

Trucs et astuces pour tirer le maximum de vos analyses hreflang avec OnCrawl

Exploration des détails des hreflang par URL

Lorsque vous visualisez des résultats dans le Data Explorer, vous trouverez des détails complets sur l’environnement hreflang d’une URL dans la colonne « Hreflang error details ». Si cette colonne n’est pas automatiquement présentée, vous pouvez l’ajouter en cliquant sur « Add columns » et en recherchant « Hreflang error details ».

OnCrawl hreflang error results

Cliquez sur « View details » pour ouvrir la fenêtre des détails hreflang.

OnCrawl hreflang details window

Cette fenêtre affiche trois types d’informations :

  • Toutes les pages déclarées par cette URL en tant que traduction grâce aux hreflangs. Vous pouvez accéder aux pages traduites depuis cette page. Vous pouvez également télécharger cette liste au format CSV.
  • Un lien vers chacune des pages dans le cluster hreflang de cette page, avec mention du nombre total de pages dans le cluster et la source de la déclaration hreflang pour chacune des pages du cluster.
  • Toutes les erreurs hreflang trouvées pour cette page. Chaque erreur peut être dépliée afin de visualiser plus d’informations, y compris une explication de l’erreur et une liste des URLs impliquées. Par exemple, dans le cas de l’erreur « missing outbound declarations » (déclarations sortantes manquantes),la page ne comporte pas de déclarations vers d’autres pages dans le même cluster. Vous trouverez également une liste de pages non déclarées.

Utilisation du menu de raccourcis de navigation par URL

Lorsque vous visualisez des URLs dans les résultats du Data Explorer, vous pouvez vous servir du menu de raccourcis rapides à côté de chaque URL pour accéder directement aux informations hreflang pour l’URL concernée.

OnCrawl URL navigation shortcuts

Lorsque vous rencontrez une page avec des erreurs hreflang, vous aurez fréquemment besoin de visualiser les autres pages du même cluster. Via le menu des raccourcis de l’URL, choisissez « View all pages in its hreflang cluster » pour aller directement à cette liste.

OnCrawl URL navigation shortcut menu

Il peut arriver que vous deviez visualiser toutes les pages qui indiquent une URL comme une traduction hreflang. Depuis le menu des raccourcis de l’URL, choisissez « Get hreflang pointing to this page ». Ce raccourci est particulièrement utile lorsque vous avez des erreurs qui produisent de très grands clusters hreflang : il s’agit le plus souvent de plusieurs pages qui, malgré leur contenu différent, déclarent toutes la même page comme traduction. (Cette page de traduction est souvent la page d’accueil.Hreflang cluster pointing to homepages

Paramétrage d’un crawl pour optimiser l’analyse hreflang

N’oubliez pas que vos rapports de crawl n’affichent que ce qui a été crawlé. Lorsque vous commencez à lancer des crawls pour profiter des nouvelles métriques hreflang, il faut tenir compte de la structure de votre site.

Si votre site est paramétré avec des pages internationales…

  • sur des domaines différents, comme monsite.fr et monsite.de, il faut alors indiquer tous les domaines régionaux ou linguistiques comme start URLs dans les paramètres du crawl.
  • sur des sous-domaines différents, comme fr.monsite.com et de.monsite.com, il faut indiquer tous les domaines régionaux ou linguistiques comme start URLs dans les paramètres du crawl.
  • sur des repertoires différents, comme www.monsite.com/fr et www.monsite.com/de, il faut vérifier que notre bot aura accès aux deux répertoires. Nous conseillons d’indiquer tous les répertoires concernés comme start URLs dans les paramètres du crawl.
  • qui utilisent des paramètres différents, comme www.monsite.com?lang=fr et www.monsite.com?lang=de. Il faut savoir que cette stratégie n’est pas la plus recommandée en SEO. Il est assez difficile pour un bot de suivre les liens correctement, et cela complique ainsi l’indexation de vos pages par les moteurs de recherche. Notre bot aura les mêmes difficultés que celui de Google.Cependant, ceci ne vous empêche pas de crawler votre site afin de valider ce que Google y voit. Vous devrez vérifier que notre bot a accès aux paramètres. Dans les paramètres du crawl, cliquez sur « URL with parameters » pour déplier la section. Vérifiez que la case « Crawl URLs with parameters » est cochée. Si vous utilisez d’autres paramètres que vous ne souhaitez pas crawler, cochez également la case « Filter URL parameters » et indiquez uniquement les paramètres de langue (ou excluez les paramètres non-linguistiques, selon ce qui vous paraît le plus facile à faire). Indiquez toutes les URLs des langues, avec leurs paramètres, comme start URLs dans les paramètres du crawl. Si les résultats du crawl ne sont pas satisfaisants, vérifiez que tous les liens de votre site contiennent des paramètres, puis essayez à nouveau.

Disponibilité

Cette nouvelle fonctionnalité ne demande aucun paramètrage préalable. Elle est incluse dans tous les plans et abonnements.

Pour plus d’informations sur l’analyse hreflang d’OnCrawl, consultez cet article dans notre base de connaissances.
Si vous n’êtes pas encore utilisateur OnCrawl, il est encore temps de profiter d’un essai gratuit de 14 jours.

Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :