Demandez à n’importe quel SEO, quelle tâche le fait le plus grimacer. Il répondra certainement le link building ou la migration de site. La plupart des experts s’alignent sur le premier : le link building peut vraiment être pénible. La deuxième réponse me surprend toujours. Je suis un grand fan des migrations de sites web et j’ai même écrit sur les raisons pour lesquelles vous devriez donner la priorité à votre migration en ce moment.
Pourquoi tant d’angoisse à propos des migrations de sites web ? Ce n’est pas sans mérite. Une mauvaise migration sans tenir compte du référencement peut entraîner une baisse significative des performances. Vous trouverez ci-dessous un exemple en image qui permet d’éviter que le référencement ne soit interrompu la nuit. Je ne vais pas écrire sur chaque étape d’une migration réussie, mais je vais présenter des solutions scalables pour l’un des plus grands freins : les redirections.
L’échec de la migration de ce site en 2018 leur a pris près de 3 ans pour retrouver leur performance organique
Objectif des redirections pour la migration d’un site web
Afin d’éviter une baisse catastrophique des performances organiques après la migration d’un site web, des redirections 301 doivent être mises en place. Le processus commence par la mise en correspondance de chaque page de votre ancien site web avec le nouveau. Cela nécessite un mapping 1:1. Une fois que les URLs sont cartographiées, vous pouvez utiliser votre fichier HTACCESS pour mettre en place une redirection 301 pour chaque URL. Si les redirections ne sont pas correctement mappées ou si le statut 301 n’est pas utilisé correctement, le trafic organique après le lancement du site diminue souvent.
Le mapping des pages principales de votre site web (page d’accueil, à propos de nous, pages de catégories ou même articles/blog) est assez simple, même s’il est effectué manuellement. Cependant, comment cartographier les redirections d’un site e-commerce qui compte des milliers, des centaines de milliers, voire des millions de pages projet ? Couvrons deux approches uniques.
Approche 1: Identifier les modèles d’URLs
En exploitant votre site web et vos environnements de développement actuels, vous pourrez comparer un seul produit. En supposant que votre migration nécessite un changement d’URLs, il est temps d’identifier les éventuels schémas. Par exemple, si le CMS de votre site web actuel est Magento et que vous migrez vers Shopify, vous trouverez ci-dessous les deux URLs différentes pour le même produit.
MAGENTO .com/nom-du-produit.html
SHOPIFY .com/produits/nom-du-produit
Dans ce cas, nous pouvons utiliser Excel pour mettre à l’échelle la cartographie des URLs sans avoir besoin de cartographier chaque produit individuellement.
Colonne A – liste de toutes les URLs de produits de votre site existant (utilisez votre crawler préféré pour obtenir cette liste)
Colonne B – Utilisez la formule « concaténer » =CONCATENER(« /produits »,A2)
Colonne C – Effacez les 5 derniers caractères (.html) par la formule GAUCHE =LEFT(B2, LEN(B2)-5)
Passez vos valeurs de la colonne C dans votre crawler SEO (après avoir ajouté votre URL dev) pour vous assurer que toutes les lignes ont un statut 200. Si cela fonctionne, vous disposez maintenant d’une solution évolutive pour toutes les URLs produits, de l’ancien site Magento au nouveau site Shopify.
Approche 2 : Que faire si les URLs des produits sont différents ?
Que faire si les URLs des produits de votre ancien site web n’utilisaient pas le nom du produit ou étaient générées directement par une base de données ? Il faudra identifier des modèles et un crawler SEO comme Oncrawl ou Screaming Frog SEO Spider.
Exemple : l’ancien site web génère des URLs de produits par la valeur SKU du produit.
Ancienne URL : .com/produit/38472
Nouvelle URL : /com/produit/casquette-de-baseball-grise
Solution 1 : Comparez les étiquettes de titre (VLOOKUP)
S’il n’existe pas de solution facile pour faire correspondre les URLs entre les deux sites, nous devrons passer à la solution suivante. Les valeurs des balises de titre de la production ont-elles été déplacées vers le nouveau site de développement ? Si c’est le cas, nous pouvons utiliser les crawls pour comparer la production et le nouveau site de développement afin de trouver les valeurs correspondantes.
Exemple : Pas de corrélation entre les URLs des produits, mais les valeurs de la balise titre correspondent
Étape 1 : effectuer des recherches complètes sur le site web de production actuel ainsi que sur l’environnement de développement.
Étape 2 : Exportez les deux crawls vers un document Excel, chacun dans son propre onglet dédié.
Étape 2 : nous allons exécuter une valeur VLOOKUP. Pour que cette étape fonctionne correctement, nous devons placer la valeur de la balise title devant l’URL. Après avoir déplacé la colonne G vers la colonne B, chaque onglet ressemblera à ceci.
Étape 3 : Ouvrez un onglet « feuille 3 » et dans la colonne A, copiez et collez les valeurs de la balise titre de votre onglet de développement. Créez la colonne B pour y inscrire l’URL de votre production. La colonne C sera votre nouvelle URL de développement.
Étape 4 : Lancez un VLOOKUP à partir de votre feuille 3 dans vos onglets de production et de développement correspondant aux valeurs des balises de titre. Si vous configurez vos feuilles exactement comme je l’ai fait, c’est le code VLOOKUP dont vous aurez besoin pour chaque valeur.
=VLOOKUP(A2,Production!$A1:B100000,2,FALSE)
=VLOOKUP(A2,Development!$A1:B100000,2,FALSE)
* Notez que si vous avez plus de 100 000 valeurs dans vos feuilles de calcul, vous devrez modifier la valeur B1 pour qu’elle soit supérieure à la valeur par défaut de 100 000 que j’ai mise en place.
Le résultat final de l’exécution des crawls, de l’organisation des données dans le tableur et de l’exécution de VLOOKUP est une feuille unique avec vos URLs actuelles et celles de vos nouveaux sites de développement.
Solution 2 : Comparaison des copies de corps de produits (XPath/VLOOKUP)
Lorsque les URLs sont complètement différentes et que les balises titre ne correspondent pas, vous pourriez être tenté de retrousser vos manches et de commencer à faire correspondre manuellement les URLs. STOP – J’ai encore un conseil à vous donner.
Nous allons utiliser l’extraction personnalisée pour extraire et faire correspondre le corps des pages de chaque produit. Nous allons ensuite utiliser la commande VLOOKUP que nous avons utilisée dans l’exemple de la balise titre pour faire correspondre les deux URLs.
Étape 1 : ouvrir une page produit correspondante sur le site de production et le site en développement. Vérifiez que les descriptions de produits sont effectivement les mêmes sur les deux sites.
Étape 2 : dans le navigateur Chrome, vous pouvez cliquer avec le bouton droit de la souris sur la description du produit et cliquer sur « inspecter l’élément ». Cela ouvrira les outils de développement Chrome et vous amènera à la section de code que nous allons supprimer.
Dans Chrome dev tools, faites un nouveau clic droit et sélectionnez « Copy » puis « Copy XPath ». Vous obtiendrez une valeur similaire à celle-ci :
//*[@id= »3796805_productDetails »]/div/p[1]
Étape 3 : Dans Oncrawl, allez jusqu’à l’option « Scraping » dans la configuration du profil de crawl (+ Configurer un nouveau crawl > Scraping). Saisissez un nom pour ce champ, par exemple « description » et collez votre code XPath que vous avez récemment copié à partir des outils de développement de Chrome. Vous devrez ajouter « /text() » à la fin pour saisir le texte de la description du produit.
Dans cet exemple, j’ai également coché « Condenser les espaces » pour éviter tout caractère de paragraphe dans la description.
Étape 4 : Testez votre logique d’extraction personnalisée.
Dans Oncrawl, avant de sauvegarder votre règle, vous devez entrer quelques URLs dans la case « Vérifier la sortie » en bas et vous assurer que lorsque vous cliquez sur « Vérifier » vous voyez la description dans la case à droite :
Après avoir validé que la logique d’extraction fonctionne correctement, lancez toutes les URLs de vos produits. Vous pourrez exporter toutes vos descriptions extraites (liées à une URL) une fois le crawl terminé.
Étape 5 : À ce stade, vous allez répéter les étapes 1 à 3 pour votre site en développement. Vous aurez maintenant deux onglets différents pour chaque environnement où chaque URL produit a une description extraite qui lui est associée.
Étape 6 : Comme pour l’exemple de la balise title, nous allons utiliser VLOOKUP pour faire correspondre les descriptions de produits entre les sites de production et de développement. Si cela est fait correctement, vous aurez une liste d’anciennes et de nouvelles URLs que vous pouvez maintenant utiliser pour faire correspondre vos redirections.
La logique d’URL, les balises titre et meta description ont échoué ?
N’abandonnez pas. Je vous promets que la dernière chose que vous voulez faire est de consacrer le nombre d’heures nécessaires pour faire correspondre manuellement toutes ces URLs. Voici quelques autres tactiques que j’ai déjà observées avec plus ou moins de succès :
- Identifier et faire correspondre les valeurs de balisage de Schema.org
- Identifier et faire correspondre le nom de l’image et/ou les balises alt de l’image
- Parfois, vous avez de la chance et un SKU réel fera partie d’un modèle de produit
- Identifier et faire correspondre les évaluations de produits
Dernier effort pour cartographier les redirections produits
Parfois, les produits subissent une telle révision qu’il est impossible de ne pas avoir à établir manuellement une cartographie 1:1. Si c’est votre cas, envisagez d’utiliser toutes les tactiques ci-dessus pour en identifier le plus possible. En dernier recours, envisagez de faire appel à vos stagiaires ou à des ressources plus juniors pour vous aider à résoudre les problèmes liés aux produits restants.
Bien que les tactiques énumérées ci-dessus ne soient pas une solution à l’épreuve du feu, j’ai constaté qu’elles permettent de résoudre un grand nombre de problèmes. Même si elles résolvent seulement 75% de vos redirections, vous serez reconnaissant de récupérer le temps que vous auriez autrement passé à cartographier manuellement ces redirections.