Comment détecter les pages orphelines en utilisant OnCrawl ?

3 juin 2016 - 4  min de lecture - par Emma Labrador
Accueil > SEO Technique > Comment détecter les pages orphelines en utilisant OnCrawl ?

Les pages orphelines, en tant que page web sans liens entrants ou page parente, méritent toute votre attention. En effet, vous êtes peut être en train de gaspiller du trafic organique précieux et de la valeur SEO.
En fait, savoir où se trouve vos pages orphelines et les rattacher à la structure de votre site peut être extrêmement bénéfique pour votre SEO.

Que sont les pages orphelines ?

Le terme ‘orphelin’ est utilisé pour mentionner l’absence de pages parentes ou autrement dit, les pages qui ont des liens pointant vers leurs pages enfants. Les pages orphelines sont difficiles à crawler pour les moteurs de recherche car les robots suivent les liens pour parcourir un site. S’il n’y a pas de lien pour accéder à une nouvelle page, celle-ci sera pratiquement impossible à indexer à moins qu’un lien externe pointe vers elle. Les pages orphelines sont des pages qu’on ne peut atteindre, de n’importe quel endroit du site, et que les utilisateurs ne peuvent pas trouver.

Même si les pages orphelines peuvent être implémentées de manière intentionnelle afin qu’elles ne soient pas crawlées, c’est souvent la faute des webmasters qui ont oublié de lier les pages web entre elles.

Comment apparaissent les pages orphelines ?

Une page orpheline peut être envisagée et mise en place de manière intentionnelle ou non. Voici quelques raisons pour lesquelles les pages orphelines peuvent être attendues:

  • Les pages liées à des sites externes, en tant que redirections. Les pages rédirigées sont toutes orphelines puisque les liens internes devraient toujours amener l’utilisateur sur la bonne page.
  • Les pages expirées sur un site qui possède de nombreuses pages à courte durée de vie. En fait, elles expirent le temps du crawl; cela peut donc devenir dangereux si elles restent orphelines pendant une trop longue période.
  • Les pages qui présentent des erreurs qui ont été corrigées mais que Google continue de crawler pour un certain temps.

D’un autre coté, les pages orphelines peuvent également apparaître de manière inattendue et devenir un problème.

  • Les pages qui sont seulement reliées à la structure selon les critères de navigation (comme les pages catégories ou les pages de résultats de recherche interne). Ces pages devraient toujours être reliées à la structure si elle génèrent du trafic organique.
  • Les pages expirées qui affichent toujours du contenu: certains sites arrêtent simplement de pointer vers du contenu expiré et ne fournissent pas le bon status code (comme une 404 ou une redirection vers une nouvelle version). La page expirée est donc encore disponible.
  • Les pages qui n’ont pas migré correctement: il n’y a pas de redirection et le contenu expiré est toujours disponible.
  • Les erreurs de syntaxe pendant la création de balises canoniques. Cela crée de fausses URLs (HTTP 200 ou erreurs).
  • Les erreurs de syntaxe pendant la création de sitemaps. Cela créer de fausses URLs qui peuvent fournir du contenu et des doublons ou faire apparaître des erreurs HTTP.

Comment détecter facilement les pages orphelines ?

Puisque les robots ont du mal à détecter ce type de pages, votre crawler SEO actuel n’en sera pas capable non plus. C’est pour cette raison que vous devez associer vos données de crawl à une analyse de logs et fusionner les informations.

Chez OnCrawl, nous fournissons une analyse croisée qui vous permet d’aller plus loin qu’un simple crawl et de combiner vos données avec une analyse de logs.
Vous pouvez ainsi connaître toutes vos pages: celles présentes dans la structure et celles qui ne sont pas crawlées par Google.

Avec ces données, vous pouvez réellement connaître les pages qui ne sont pas prises en compte par Google et mais qui génèrent quand même des visites SEO et du trafic organique. Ces pages sont toujours précieuses.

OnCrawl montre également clairement combien de pages orphelines vous avez et combien sont actives. Ces dernières sont intéressantes puisqu’elles ont généré au moins une visite SEO.

OnCrawl affiche également la répartition de vos pages orphelines par groupes de pages et vous permet de déterminer l’endroit où celles-ci sont situées. Vous pouvez cliquer à n’importe quel endroit du graphique et accéder aux URLs concernées.

Vous pouvez également analyser la part des pages orphelines et des autres pages dans la structure par rapport à toutes les pages connues par Google et OnCrawl, par groupe de page.

Il est aussi intéressant de savoir si ces pages orphelines génèrent des visites SEO. Cela implique qu’elles pourraient être optimisées si elles étaient reliées à la structure.

Selon votre budget de crawl, vous pouvez également savoir si Google gaspille trop de budget de crawl en analysant vos pages orphelines.

Enfin, vous pouvez aussi comparer vos pages orphelines actives et inactives et voir celles qui ne génèrent aucun trafic SEO.

Il n’a jamais été aussi simple de détecter les pages orphelines. Si vous êtes intéressé par cette procédure, n’hésitez pas à demander une démo ! Nous serions enchantés de vous montrer toutes les opportunités SEO disponibles, que vous êtes peut être en train de manquer.

Emma est Responsable Communication & Marketing chez OnCrawl et écrit sur le SEO et les mises à jour des moteurs de recherche.
Sujets en lien :