split testing

Contenu dupliqué et sites e-commerce : les bonnes pratiques

11 avril 2017 - 7  min de lecture - par Julie Quintard
Accueil > SEO Thoughts > Contenu dupliqué et sites e-commerce : les bonnes pratiques

Les sites e-commerce font souvent face à des problèmes de contenu dupliqué ou à du contenu mince et de faible qualité. Ces types de problèmes SEO sont pénalisés par les moteurs de recherche. En fait, Google et d’autres moteurs de recherche sont de plus en plus strictes envers les sites et récompensent davantage un contenu qualitatif et unique. Cet article se concentre sur les différents types de contenu dupliqué auxquels sont confrontés les sites e-commerce.

Contenu dupliqué interne

URLs non-canoniques

Les URLs canoniques aident les moteurs de recherche à savoir qu’il n’y a qu’une seule URL qui devrait être indexée pour un contenu. Les canoniques sont spécialement utilisées pour le suivi des URLs, mais aussi pour les catégories de pages URLs où le tri, le filtrage et les paramètres fonctionnels sont ajoutés à la fin des URLs. L’ajout d’une canonique dans le code source de l’URL de base empêchera les moteurs de recherche d’indexer ces URLs en double.

Types of duplicate URLs ecommerce websites

Vous pouvez également refuser que le robot crawle certaines URLs avec un fichier robots.txt pour conserver votre budget de crawl. Pour ce faire, utilisez ce type de configuration :

User-agent: *
Disallow: *&order=*
Disallow: *?price=*

Chemins d’URL dupliqué

La manière dont un CMS traite les structures d’URL d’un produit peut potentiellement entraîner des problèmes de duplication importants. Par exemple, disons qu’un produit est situé dans la catégorie A et B et que les répertoires de catégorie sont utilisés dans la structure d’URL des pages de produit, deux URLs différentes sont alors créées pour le même produit. Pour éviter ce type de duplication, vous pouvez :

  • Utiliser des répertoires URL /produit / de tous les produits ;
  • Utiliser des pages produit de premier niveau ;
  • Utiliser des URLs de produit développées sur des structures d’URL de catégorie avec une seule URL canonique pour chaque URL de page de produit.

Les identifiants de session

Les identifiants de session aident les sites e-commerce à suivre le comportement des utilisateurs, mais ils créent également des doublons pour les moteurs de recherche. Pour chaque identification de session, il se crée un double de l’URL principale. La meilleure solution pour éviter ceci est d’utiliser des cookies au lieu de codes d’identification pour chaque URL. Mais vous pouvez également canoniser les URLs d’identification de session ou interdire le crawl d’URL d’identification avec un fichier robots.txt tant et aussi longtemps que le système CMS ne produit pas d’identifiants de session pour les robots de recherche. Le bon format devrait être ainsi :

User-agent: *
Disallow: *?sid=*

Pages d’évaluation de produit

La plupart des CMS offrent des fonctionnalités intégrées d’évaluation avec des pages distinctes regroupant tous les avis d’un produit. Il peut se créer du contenu dupliqué entre les pages produits et les pages d’évaluation. Vous devriez ajouter une canonique sur les pages d’évaluation vers la page principale du produit ou insérer un noindex/follow dans la balise x-robots. Si vous souhaitez conserver le jus de lien de la page d’évaluation à partir d’un site externe, conservez l’option canonique.

URLs en WWW vs. les URLs sans WWW

Les moteurs de recherche considèrent http://www.domain.com et http://domain.com comme des adresses différentes. Il est donc important qu’une seule version de l’URL soit sélectionnée. Pour ce faire, la meilleure option est de rediriger en 301 la version non-préférée vers la version choisie pour éviter tout problème de duplication. Vous pouvez également définir un domaine préféré dans les Webmaster Tools.

Contenu éditorial dupliqué interne

Pages avec catégories

Les pages avec catégories sont un autre élément du e-commerce qui fournissent des maux de tête aux SEOs. Les pages avec catégories n’ont généralement qu’un titre et une grille de produits. Le contenu est donc mince et pauvre selon les les critères Google. Pour éviter les pénalités de Google, vous devez ajouter jusqu’à 300 mots en haut des pages avec catégories en décrivant le produit que vous voulez trouver afin de maximiser vos chances d’indexation. Profitez-en pour créer un lien direct vers des sous-catégories, un article ou tout autre contenu associé qui pourrait ajouter de la valeur aux pages de votre catégorie. Vous allez ainsi enrichir votre maillage interne et votre référencement.

Contenu similaire entre produits

Un site e-commerce traite de nombreux produits différents et certains d’entre eux peuvent être très similaires. Ces descriptions de produits similaires biaisent Google qui peut les considérer comme du contenu similaire. Il faut donc que les pages produits des sites e-commerce soient uniques, attrayantes et qualitatives, en particulier pour les sites qui utilisent des mots-clés très concurrentiels.

Prendre le temps d’écrire des descriptions de produits uniques peut jouer un rôle important quant à vos positions.

Contenu dupliqué de la page d’accueil

Votre page d’accueil est l’entrée de votre site et c’est elle qui habituellement reçoit toute l’attention quant au tunnel d’achat, les stratégies de liens et les optimisations techniques. Mais pour les sites e-commerce, il est également important de veiller à ce que le contenu unique se retrouve en majorité sur la page d’accueil et que vous ne proposiez pas seulement un aperçu de vos produits. Les aperçus de produits offrent peu de valeur contextuelle aux moteurs de recherche pour indexer votre contenu et classer votre site sur des mots-clés concurrentiels.

Contenu dupliqué externe

Le contenu dupliqué est une préoccupation SEO qui peut se produire à l’intérieur et à l’extérieur d’un site et même entre différents sites e-commerce. Le contenu dupliqué externe peut être compliqué pour les sites e-commerce qui tentent de se classer efficacement sur des mots-clés recherchés. Voyons certains des problèmes les plus courants du contenu dupliqué externe.

Descriptions produits des fabricants

Il est assez courant de lire la même description de produit sur différents sites e-commerce. Le fait est que les fabricants de produits offrent une description générale des produits pour tous les sites avec lesquels ils travaillent. Les moteurs de recherche considèrent ces multiples sites avec les mêmes descriptions comme des sites de faible qualité, car ils n’offrent aucune valeur supplémentaire aux utilisateurs. Seuls les sites d’autorité (et avec beaucoup de backlinks) auront des chances de se classer pour un produit en question.

Si vous êtes confronté à ce problème, vous devrez prendre le temps de réécrire vos descriptions de produits existantes et vous assurer que toute prochaine description aura également des textes uniques. Il ne fait aucun doute que cela prend beaucoup de temps, mais toutes ces améliorations SEO auront un impact sur votre classement.

Du moins, réécrivez un contenu unique pour vos produits prioritaires ou pour vos best sellers. Assurez-vous également que vous prenez le temps d’écrire un contenu unique pour un produit qui a une durée indéterminée sur votre site et non pour un produit qui sera supprimé au cours des prochaines semaines.

Flux de produits

Certains sites e-commerce étendent également leurs produits sur des sites commerciaux tiers pour augmenter leurs chances de conversion. Cette stratégie crée également du contenu dupliqué externe.

L’ironie ne s’arrête pas là. La plupart du temps, ces sites tiers ont plus d’autorité que le site principal en soi. Prenez l’exemple d’Amazon qui vend des milliards de produits à partir de sites tiers. En termes de stratégie de revenus, c’est génial, car le produit va être mieux exposé, mais en termes de SEO, le trafic de votre site e-commerce risque d’être pénalisé. Ce qu’il faut savoir c’est que pour deux versions identiques, Google donnera une meilleure chance à des sites d’autorité.

La solution est simple. Assurez-vous que les produits situés sur des sites tiers ont des descriptions uniques. Vous pouvez garder la description du fabricant pour un site tiers pour gagner du temps.

Sites en pré-prod et en test

Cela peut sembler fou, mais il arrive que des sites en pré-prod soient indexés et trouvés par les moteurs de recherche, créant ainsi un contenu dupliqué exact de votre version en ligne. N’ayez pas peur, des solutions simples existent :

  • Insérez un “noindex,nofollow” méta-robots à chaque page sur le site en pré-prod ;
  • Empêchez les robots des moteurs de recherche de crawler des sites via une commande « Disallow: / » dans le fichier /robots.txt sur le site en pré-prod ;
  • Configurez les sites test séparément dans les Webmaster tools et utilisez l’outil «Supprimer les URLs» dans les Webmaster tools pour que l’ensemble du site en pré-prod soit retiré de l’index de Google ;
  • Créez un mot de passe sur le site en pré-prod, afin d’empêcher les moteurs de recherche de le crawler ;

Si les moteurs de recherche ont déjà indexé votre site, ces solutions sont celles qui fournissent les meilleurs résultats.


Oncrawl a développé un puissant outil pour le contenu dupliqué et similaire pour détecter tous vos types de contenu dupliqué.

Vous pouvez également filtrer votre contenu dupliqué par groupe de pages et par similarité de contenu :

Nous avons été les premiers à fournir un détecteur de contenu dupliqué basé sur la méthode Simhash pour contrer l’un des problèmes les plus courants des sites e-commerce.

Julie Quintard Voir tous ses articles
Julie était pendant de nombreuses années Marketing Manager pour Oncrawl. Passionnée de digital et de marketing, elle écrivait régulièrement des articles sur les actualités du SEO et d'Oncrawl. Vous pouvez la joindre sur Twitter.
Sujets en lien :