Code HTTP : impact SEO et optimisation

30 mars 2021 - 10  min de lecture - par Jérôme Salomon
Accueil > SEO Technique > L’impact en SEO des codes HTTP

Incontournable dans un audit technique SEO, l’analyse d’un code HTTP avec Oncrawl permet en quelques clics de faire un état des lieux des requêtes HTTP au sein de la structure de votre site. Il vous reste alors à vérifier que ces status codes sont bien ceux attendus, le cas échéant à appliquer des corrections, puis à corriger votre maillage interne.
Le présent article vous explique l’impact en SEO des principaux status et comment bien optimiser leur utilisation pour en tirer le meilleur parti. Avant de poursuivre, vous pouvez consulter notre article consacré aux status codes et leur signification.

Code HTTP 200

200 OK

La requête HTTP fait au serveur aboutit, tout est normal. La page en question pourra être crawlée (si pas de blocage par robots.txt) par les bots Google et autres moteurs de recherche.

Attention tout de même, cela ne signifie pas pour autant qu’il n’y a aucune action nécessaire pour cette page et que le status code HTTP est bien celui attendu. Dans certains cas, des pages en erreurs ou inexistantes peuvent répondre en 200 alors que ce n’est pas optimal d’un point de vue SEO.

Ces pages pourront être identifiées sur Oncrawl avec une combinaison de plusieurs critères :

  • Présente dans le groupe « Other » qui contient les pages non catégorisées de votre segmentation
  • Nombre de mots très faible
  • Balises canonical qui ne correspondent pas
  • Taux de similarité très élevé
  • Balises title et description non optimisées
  • Balises H1, Title, Description dupliquées
  • Pages sans H1

Comme nous le verrons dans la suite de l’article pour ces pages erronées, il faudra non seulement les retirer du maillage interne mais il sera également préférable de faire en sorte qu’elles répondent avec un status code HTTP plus utile pour le SEO.

Bonnes pratiques :

  • Assurez-vous que les pages que l’on veut indexer répondent en 200
  • S’assurez que les pages qui répondent en 200 sont des “vraies” pages pour bien maîtriser son maillage interne et son crawl budget

Code HTTP 3XX

301 Moved Permanently

La page demandée a été déplacée et redirigée vers une autre URL de manière permanente. Très utile en SEO, la redirection permanente permet de gérer les cas de migration de site de tout type (changement de domaine, migration http vers https, refonte, etc) mais surtout de modifier l’URL d’une page sans perdre le trafic entrant.
Le bot Google ne pourra plus accéder à la page d’origine et va suivre la redirection pour découvrir la page de destination. Il comprendra que la page a été déplacée et qu’il ne faut plus crawler la page d’origine.
Conséquences pour votre SEO :

  • À terme la page d’origine va être désindexée
  • La page de destination va être indexée mais rien ne garantit qu’elle récupère les positions de la page d’origine
  • Le jus SEO des backlinks reçu sur la page d’origine est transmis à la page de destination

Ce dernier point est un atout essentiel de votre stratégie SEO dans le cadre d’une migration ou simplement de la mise à jour du contenu de votre site. Si Google recommande de ne mettre en place des redirections 301 que vers un contenu identique ou similaire, et donc de ne pas rediriger de manière automatique vers la home page, il faut prendre en compte les backlinks que reçoit la page d’origine. Si la page n’existe pas ou plus mais reçoit des backlinks intéressants, il est judicieux à minima de mettre en place une 301. S’il n’existe pas de contenu similaire, la redirection doit se faire vers la rubrique parente en priorité sur la home page en suivant l’arborescence du site (on peut se baser sur le fil d’ariane ou les dossiers dans l’URL). Par exemple, pour une page produit on fera une redirection vers le listing produit plutôt que la home page.

La logique est différente concernant le maillage interne de votre site. Il est préférable de corriger tous liens pointant vers des pages en status codes HTTP 301 mais compte tenu du fait que le jus SEO est transmis, n’en faites pas une priorité. En revanche, toutes les redirections pointant vers des pages qui ne répondent pas en 200 devront être traitées prioritairement.

Les bonnes pratiques :

  • Assurez-vous que la page de destination réponde en 200. Oncrawl permet de détecter facilement les chaînes de redirection et les redirections qui ne pointent pas vers une page en 200
  • Corrigez les liens pointant vers des pages en 301
  • Limitez l’utilisation de la 301 avec une redirection automatique de toutes les erreurs 4XX vers la home page
  • Préférez la rubrique parente à la homepage pour les redirections sans contenu similaire
    • Mettez en place une redirection si :
  • Le contenu est déplacé
  • Un contenu similaire remplace la page d’origine
  • La page est supprimée mais reçoit des backlinks intéressants

302 Found

La page demandée est temporairement redirigée vers une autre URL. Comme la redirection permanente 301, la redirection temporaire 302 permet de conserver le trafic entrant avec un expérience utilisateur transparente, mais elle n’offre pas les mêmes avantages en SEO. Le bot Google comprendra que la page d’origine est temporairement inaccessible et qu’elle le sera à nouveau.
Conséquences pour votre SEO :

  • Le bot Google va continuer d’essayer de crawler la page d’origine
  • La page d’origine va conserver sa popularité
  • Le jus SEO du netlinking ne sera pas transmis à la page de destination
  • La page d’origine ne sera pas désindexée (si la page n’est pas indexée, elle ne le sera pas tant qu’elle répond en 302)

Il est donc inutile de corriger vos 302 au sein du maillage interne, mais il est recommandé de vérifier régulièrement que les 302, détectées dans votre structure à l’aide d’un crawl ou des logs, sont bien temporaires.

Les bonnes pratiques :

  • Utilisez la 302 seulement pour des besoins temporaires, comme une maintenance par exemple
  • N’utilisez pas de 302 pour des contenus déplacés ou supprimés de manière définitive
  • Remplacez les 302 par des 301 si elles deviennent définitives.

304 Not Modified

La page demandée n’a pas été modifiée depuis la dernière consultation. La page en question n’a donc pas besoin d’être crawlée à nouveau par le bot Google, qui utilisera la version cache. Assez méconnu, ce status code HTTP 304 offre la possibilité d’économiser du budget crawl. Le bot Google va utiliser la version cache et accéder instantanément à la page demandée.
Conséquences pour votre SEO :

  • La page n’est pas crawlée à nouveau ce qui évite la consommation des ressources et du crawl budget
  • Le temps de chargement de la page s’en trouve amélioré (version cache)

La mise en place de ce type de réponse pour les pages “classiques” peut être difficile et demander des développements. En revanche, pour les pages de ressources de type CSS cela peut-être un vrai quickwin.

Les bonnes pratiques :

  • Pour les pages qui ne sont jamais modifiées préférez le 304 au 200
  • Etudiez la possibilité de généraliser la pratique pour les pages de ressources

Code HTTP 4XX

404 File Not Found

Le serveur n’a trouvé aucune page pour l’URL demandée, ce qui signifie que la page n’existe pas. Cela peut-être temporaire ou définitif, généralement la page est accessible via un lien non-fonctionnel ou par un internaute tapant la mauvaise URL.
Conséquence pour votre SEO :

  • Le bot Google comprend que cette page n’existe pas et qu’il ne faut pas l’indexer
  • Si la page est déjà indexée, elle finit par être désindexée
  • Le jus SEO du netlinking sera perdu une fois la page désindexée

Souvent vue comme l’erreur à corriger à tout prix en SEO, le status code HTTP 404 est en fait très utile pour le référencement. Il permet d’éviter que Google n’indexe des urls erronées ou des contenus qui n’existent plus (même si l’on verra ensuite que le code HTTP 410 est plus efficace dans ce cas). Google est d’ailleurs clair à ce sujet, les 404 ne sont pas problématiques. Au contraire, elles permettent d’éviter que des URLs erronées soient considérées comme de véritables pages de votre site.

Pour offrir une bonne expérience utilisateur, la recommandation est de créer une page d’erreur 404 personnalisée qui :

  • Indique explicitement que la page n’existe pas
  • Soit intégrée au design de votre site
  • Propose des liens vers du contenu accessible
  • Ne soit pas indexable (réponse en 404 et meta robots noindex)

À noter que les liens présents sur une page 404 personnalisée seront comptabilisés dans le maillage interne. Il est recommandé de corriger tous les liens de votre site pointant vers une 404 pour éviter une dilution de la popularité interne au profit des liens du menu et du footer et pour ne pas gaspiller votre crawl budget.

Les bonnes pratiques :

  • Mettez en place la 404 quand:
    • la page n’existe pas (si elle n’existe plus, préférer une 410)
    • la page n’a pas de backlink important
    • il n’y a pas de contenu équivalent disponible
  • Créez une page 404 personnalisée
  • Evitez la soft-404, c’est-à-dire une page 404 personnalisée qui répond avec un status code HTTP 200
  • Ne redirigez pas systématiquement les 404 avec une 301
  • Ne bloquez pas l’accès à une page 404 via robots.txt
  • Corrigez tous les liens pointants vers une 404

410 Gone

La page demandée n’est plus disponible et ce de manière définitive. La différence avec le status code HTTP 404 réside dans cette subtilité, la page a déjà existé mais a été supprimée et ne sera pas remplacée. Le message envoyé au bot Google est donc plus précis et définitif. Conséquence pour votre SEO :

  • Google va prendre en compte l’information sans délai (contrairement à la 404)
  • La page va être désindexée (quasi) immédiatement
  • Google précise que des vérifications seront faites pour s’assurer que la page n’existe réellement plus

Le statut code HTTP 410 est donc à privilégier à la 404 dans le cas où l’on souhaite désindexer rapidement une page. Mais c’est aussi un status code HTTP plus lourd de conséquence en cas d’erreur.

Il existe des moyens manuels de désindexer une page, la mise en place de réponse 410 pour les pages supprimées permet l’automatisation du processus. Il faut également bien s’assurer qu’aucun lien ne pointe vers une page répondant en 410 car l’expérience utilisateur ne sera pas assurée comme avec une 404 personnalisée.

Les bonnes pratiques de HTTP Code 4xx:

  • Préférez la 410 à la 404 pour désindexer une page supprimée
  • Ne bloquez pas l’accès à une page 410 via robots.txt
  • Corrigez tous les liens pointants vers une 410

Passez à l’action avec Oncrawl

Identifiez les requêtes HTTP de votre site avec le rapport de crawl

Rendez-vous sur le rapport CRAWL REPORT > Indexability > Status Code pour découvrir la répartition des pages par status code HTTP.

dashboard code http

Le rapport suivant permet de prioriser vos actions avec une répartition par status code et segments.

dashboard seo code http

Cliquez sur les données que vous souhaitez récupérer pour ensuite les exporter au format csv.

Pour aller plus loin, vous pouvez également récupérer les status codes via vos access logs.

Rendez-vous sur le rapport LOG MONITORING > Exploration sanity pour découvrir la répartition des pages par status code HTTP rencontré par les bots google.

status code http

Corrigez le maillage interne

Pour corriger le maillage, il faut repérer les liens qui pointent vers des pages qui ne répondent pas avec un status code 200. Vous aurez besoin des pages d’origine, des ancres et du code HTTP de la page de destination.

Rendez-vous dans le data explorer, sélectionnez le dataset Links et écrivez la requête suivante :

Il ne vous reste plus qu’à exporter en csv.
Pour les 301, si vous souhaitez également connaître la page de redirection, consultez l’article pour savoir comment créer un fichier listant tous les liens pointant vers une URL 301, l’ancienne URL et la nouvelle URL ?

Jérôme Salomon Voir tous ses articles
Jérôme Salomon est Senior Technical SEO chez Oncrawl. Jérôme accompagne les entreprises dans la mise en place d'audits techniques pour les structures de sites complexes, l'analyse des logs et des données de crawl, et l'automatisation du SEO à l'aide de Python. Il intervient aussi régulièrement en tant que formateur et conférencier sur ces sujets.
Sujets en lien :