Comment trouver toutes vos URLs avant une migration de site web

7 juillet 2020 - 7  min de lecture - par Helen Pollitt
Accueil > SEO Technique > Comment trouver toutes vos URLs

Personne n’aime les migrations de sites web. C’est une étape angoissante, et à juste titre. Si vous vous trompez, vous pourriez constater une baisse drastique de votre trafic organique. Si vous ratez une étape, vous risquez de voir votre classement s’effondrer.
Il existe de nombreux guides sur les étapes à prendre en compte avant de migrer un site web. Je voudrais me concentrer sur un aspect très important : les redirections.

Lorsque vous décidez quelles URL doivent être redirigées, il est essentiel que vous disposiez d’une liste complète d’URL à partir desquelles travailler. Il se peut que vous n’ayez pas besoin de rediriger un grand nombre d’entre elles, mais vous devez vous assurer de ne pas en oublier d’autres importantes.

Alors, par où commencer lorsque vous rassemblez votre liste d’URLs ?

Google Analytics

Google Analytics, ou l’outil de suivi de votre choix, contient de nombreuses informations sur les URLs visitées sur votre site.
Fixez votre date à une période suffisamment longue pour que vous puissiez capturer un nombre important d’URLs. Cette durée variera en fonction de la popularité du site. En général, environ 6 à 12 mois de données suffisent.

Allez à Comportement > Contenu du site > Toutes les pages

Vous obtiendrez ainsi une liste de toutes les URLs qui ont été visitées, quel que soit le canal de trafic d’où proviennent les visiteurs.
Bien que l’accent puisse être mis sur la mise en place de redirections afin de maintenir un trafic organique vers le site, d’autres canaux peuvent avoir besoin de mettre à jour leurs URLs ou de les rediriger. Par exemple, si la structure de l’URL du nouveau site change, les publicités PPC, les campagnes d’emailings et les publicités des réseaux sociaux peuvent avoir besoin de mettre à jour ou de rediriger leurs URLs.

Exporter cette liste.

Si vous souhaitez uniquement trouver les URLs sur lesquelles les visiteurs atterrissent à partir des résultats de la recherche organique, allez plutôt dans Acquisition > Canaux et sélectionnez Organique, puis une dimension secondaire de Pages d’atterrissage. Vous obtiendrez ainsi une liste de toutes les URLs sur lesquelles les visiteurs ont cliqué à partir des résultats de la recherche organique.

Google Search Console

Une autre sélection d’URLs qu’il est utile d’inclure dans votre liste pour envisager une redirection est celle qui se trouve dans la GSC.

Ces URLs diffèrent de celles disponibles dans Google Analytics car elles ont été vues dans les résultats de recherche mais n’ont pas nécessairement fait l’objet d’un clic. Cela signifie qu’il peut y avoir des URLs disponibles dans la console de recherche Google qui ne sont pas affichées dans Google Analytics.

Allez dans la Google Search Console; Performance et cliquez sur Pages. Une fois que vous avez défini vos dates et la durée pour laquelle vous avez des données (le maximum étant de 16 mois), vous pouvez alors exporter cette liste.

Pendant que vous êtes dans la GSC, consultez les rapports « Erreur » et « Exclus » sous « Couverture ». Ils vous donneront une idée des URLs que Google a trouvées pour votre site et qui ne sont pas affichées dans les SERPs pour diverses raisons.
Cela peut mettre en évidence certaines pages qui vous sont réellement utiles et qui doivent être corrigées et redirigées vers le nouveau site.

[Étude de cas] Gérer le crawl du robot de Google

Avec plus de 26 000 références produit, 10001pneus avait besoin d’un outil fiable pour surveiller leur performance SEO et s’assurer que le budget de crawl de Google était bien dédié aux bonnes catégories et aux bonnes pages. Découvrez comment OnCrawl les a aidé à contrôler le comportement de Google et à optimiser le budget de crawl du sites e-commerce.

Le crawl

La prochaine étape consiste à explorer votre site web à l’aide d’un outil de crawling.
Configurez le crawler de manière à respecter le fichier robots.txt et à suivre tous les liens internes.

Si vous utilisez OnCrawl, par exemple, allez à la page ‘Setup a new crawl’ pour ajuster les paramètres du crawler. Le crawler respectera le fichier robots.txt et suivra les liens par défaut :

Les liens suivent les valeurs par défaut de la configuration du crawl d’OnCrawl.

Dans OnCrawl, vous pouvez également étendre la liste des URLs connues en connectant d’autres sources d’information. Vous disposez peut-être d’une liste d’URLs provenant de votre outil de suivi des liens, ou d’une feuille de calcul utilisée par le SEA et les équipes paid.

Dans la configuration du profil de crawl dans OnCrawl, faites défiler vers le bas jusqu’à Analyse > Ingestion de données pour ajouter des listes d’URLs provenant de sources extérieures.

Une fois le crawl terminé, allez à Afficher l’analyse > Outils > Explorateur de données.

Il s’agit de la liste la plus complète que vous puissiez trouver parmi toutes les URLs que les moteurs de recherche pourraient trouver grâce aux liens de crawl de votre site web.

Au fur et à mesure de votre crawl, vous remarquerez que certaines URLs renvoient un code d’état 301 ou 302. Il est tout aussi important de noter ces codes que ceux qui renvoient un code 200. Les URLs de redirection doivent être considérées comme faisant partie de votre nouveau fichier de redirection en fonction de ce qui arrivera aux redirections existantes lorsque le site aura migré.

Vous pouvez exporter ces listes et les ouvrir en Excel.

Anciennes redirections

Si vous le pouvez, essayez d’obtenir une liste complète de toutes les redirections qui existent déjà en plus de celles que vous avez trouvées dans votre crawl.

Certains CMS vous permettront d’exporter des listes de redirections qui ont été ajoutées manuellement par leur intermédiaire. Si vous ne pouvez pas accéder à vos redirections de cette manière, vous pouvez également consulter les fichiers de configuration de votre serveur.

Il est important de savoir quelles sont les redirections déjà en place sur le site, car vous devrez peut-être vous assurer qu’elles restent actives après la migration. Il se peut que ces redirections doivent être mises à jour pour éviter un trop grand nombre de sauts de redirection, ou pour empêcher les boucles de redirection de se produire.

[Étude de cas] Optimiser le SEO après une refonte de site web

Un an après la refonte de leur site web, EasyCash ont réalisé que la performance qu’ils avaient visée n’était pas au rendez-vous. Ils ont ainsi identifié et résolu différents points SEO bloquants.

Que faire de votre liste

Il vous restera une liste assez longue d’URLs qui pourraient avoir besoin d’être redirigées. Qu’en faites-vous ?

Supprimer les doublons

La première tâche consiste à s’assurer que chaque URL n’est répertoriée qu’une seule fois. Placez les URLs dans une feuille de calcul comme Excel et « supprimez les doublons ».

Cela réduira probablement beaucoup votre liste, car il y aura certainement des chevauchements entre les URLs que vous avez trouvées via Google Analytics, Google Search Console et votre crawl.

Crawler votre site de développement

Une fois que votre site de développement a créé toutes les pages qui existeront au moment de son lancement et que vous êtes certain qu’il n’y aura plus de changement d’URLs, crawlez-la.

Vous obtiendrez ainsi une liste de toutes les URLs possibles sur le site vers lesquelles vous pouvez être redirigé.

Exportez cette liste, puis trouvez et remplacez toutes les instances du domaine de votre site de développement par le domaine sur lequel le site sera mis en ligne. Par exemple, remplacez https://example.staging-site.com par https://www.example.com.

Prenez cette liste d’URLs et ajoutez-la en haut de votre feuille de calcul des URLs potentielles à rediriger. Ensuite, mettez en évidence toutes les URLs et supprimez les doublons à nouveau.

Cela supprimera toutes les URLs de la liste inférieure qui existent également dans la liste supérieure. Cela signifie que vous supprimez de votre liste de redirections potentielles les URLs qui n’auront pas besoin d’être redirigées.

Vérifier les status codes

Ensuite, prenez votre liste d’URLs dont les doublons ont été supprimés et remettez-la dans votre outil de crawl.

Lancez le crawl de ces URLs et identifiez le code de statut renvoyé pour chacune d’entre elles. Cela vous aidera à décider quelles URLs doivent être redirigées et lesquelles ne le doivent pas.

Votre liste finale

Après ces étapes, vous devriez obtenir une liste d’URLs dont vous savez qu’elles ont reçu un certain trafic au cours des 6 à 12 derniers mois, qu’elles ont été montrées aux utilisateurs dans les SERP ou qu’elles sont disponibles pour Google lorsqu’il crawl votre site. Vous saurez également quel code de statut ils renvoient actuellement.

À partir de là, vous pouvez commencer à chercher la meilleure URL vers laquelle les rediriger.
Pour certains sites, la liste peut contenir de nombreuses URLs et, par conséquent, les rediriger toutes pourrait alourdir la charge du serveur. Vous devrez encore examiner cette liste finale et décider si l’URL mérite ou non une redirection.

Conclusion

La première étape pour rediriger vos URLs pour une migration est de comprendre quelles URLs sont déjà disponibles sur le site en ligne. Suivez ces étapes et vous disposerez d’une liste complète à analyser.

Helen est la Managing Director de l’agence Arrows Up. Elle est passionnée par tout ce qui touche au digital. Avec près de 10 ans d’expérience dans le marketing, elle crée des solutions stratégiques pour des clients, construit des équipes et donne des formations et des conférences techniques.
Sujets en lien :