[Tech & Tricks] Utiliser les dates de publication pour comprendre et prédire la performance d’une page

8 mars 2019 - 5  min de lecture - par Rebecca Berbel
Accueil > SEO Technique > [Tech & Tricks] Utiliser les dates de publication pour comprendre et prédire la performance d’une page

Combien de temps après la publication faut-il à Google, et aux visiteurs organiques, pour visiter une page ? Les pages de ce mois-ci sont-elles vraiment plus populaires que celles du mois dernier ? Cela vaut-il la peine de conserver des archives qui s’étendent sur plus de dix ans ?

Ces questions et bien d’autres encore ont été au cœur de l’analyse de notre équipe Customer Success sur plusieurs sites médias et en fonction de la date de publication de l’article. Voici leur méthode et ce qu’ils ont appris.

Comment segmenter un site par date de publication

La façon dont vous segmentez votre site dépendra de l’endroit et de la façon dont vous affichez la date de publication de vos articles.

Utiliser la donnée dans l’URL

Si vous utilisez la date de publication dans votre URL, elle peut être utilisée pour créer une segmentation. L’avantage est que votre segmentation sera basée sur une URL et que donc elle peut être utilisée dans tous les rapports, même ceux qui n’ont pas accès aux données custom indexées.

  1. Créez une segmentation, et définissez les groupes de pages basés sur la structure de l’URL.

Et voici un autre exemple utilisant les mois, trimestres et archives :

Utiliser les données scrapées depuis une page

Si la date de publication ne fait pas partie de l’URL d’une page, vous pouvez la récupérer depuis la page source au même moment que le crawler obtient les autres informations de la page. L’avantage de cette méthode est qu’elle vous autorise à créer des segmentations glissantes liées à la date du jour, ce qui peut être réutilisé d’un mois sur l’autre sans modification.

  1. Dans les paramètres de crawl, configurez vos règles de scraping pour créer un champ personnalisé appelé “datePublished”. Le nom est important.

  2. Lancez un crawl pour créer un champ personnalisé
  3. Créez une segmentation en ajoutant votre segmentation datePublished et modifiez-la si besoin.

Leçons tirées de l’observation du comportement de crawl et utilisateur vs la date de publication

La mise à jour ou la fraîcheur d’une page affecte la fréquence d’exploration et la probabilité que la page soit indexée si elle est parcourue.


La plupart des sites montrent un schéma d’augmentation de la fréquence de crawl, puis une diminution progressive. Dans ce cas, la fréquence de crawl pour le mois en cours est suffisante pour parcourir chaque nouvelle page peu après la publication. Au cours du mois suivant, Google reviendra plusieurs fois par jour pour parcourir à nouveau la page.

Lorsque les pages publiées ce mois-ci ne sont pas classées sur certains sites, c’est souvent parce qu’elles n’ont pas encore été explorées (en gris foncé). Gérer le gaspillage d’exploration pour un site comme celui-ci permet d’obtenir de nouvelles pages parcourues plus rapidement et aidera à les classer.

Le pourcentage de pages classées d’un site suit souvent une courbe similaire à celle de la fréquence d’exploration. (Notez que ce site particulier n’avait pas encore publié d’articles durant le mois où cette capture a été faite.)

La date de publication peut influencer le classement

Un pourcentage plus élevé de pages plus récentes se classent en position 1, en positions de 2 à 3 et de 4 à 10. Le pourcentage de pages classées sur ces positions décline au fur et à mesure que l’âge de la page augmente.

La date de publication peut être liée à l’apparition d’erreurs de page

Plus la page est récente, plus un utilisateur sera susceptible d’avoir un status code 200 (et une page sans erreur).

Les utilisateurs (et les robots) sont plus susceptibles de rencontrer des erreurs serveurs (5xx) et des erreurs 4xx sur des pages plus anciennes.

La date de publication peut correspondre aux problèmes de serveur ou techniques

Sur ce site, le bot d’Oncrawl et le googlebot recevaient plus fréquemment des status codes différents sur des contenus plus récents. Pour mieux promouvoir le contenu frais, il vaut mieux vérifier si les mises à jour du serveur ou du CMS au cours des derniers mois pourraient causer des fluctuations dans l’état des pages.

La date de publication peut correspondre aux valeurs de temps de chargement

Sur ce site, les temps de chargement affectent de façon disproportionnée le contenu daté. Si le contenu existant se positionne bien, il pourrait être bénéfique de renforcer son maillage interne et revoir les éléments affectant la vitesse de page afin d’améliorer sa performance.

La date de publication peut être liée à la profondeur de votre site (et si ce n’est pas le cas, optimiser la structure du site peut aider à positionner de nouvelles pages)

Les pages plus récentes apparaissent plus fréquemment plus près de la page d’accueil. Les pages plus anciennes constituent l’essentiel des niveaux plus profonds de ce site.

La présence massive de pages plus récentes à une profondeur de 2 est indicative de la promotion efficace de nouvelles pages sur ce site.

La date de publication est fortement en lien avec le comportement utilisateur

La grande majorité des visites organiques ont lieu sur des pages récemment publiées. (Notez que ce site particulier n’avait pas encore publié d’articles durant le mois où cette capture a été faite.)

La date de publication influence souvent le CTR

Plus la page est ancienne, plus il est probable que les pages classées aient un CTR de zéro.

Cependant, les pages bien promues peuvent aussi croître et maintenir des taux de clics élevés au fil du temps.

Les liens appropriés et la promotion des pages anciennes permettent à ce site de maintenir des CTR pour les contenus plus anciens qui surpassent ceux des contenus récents.

L’évolution des normes au fil du temps peut créer des problèmes de référencement pour certaines plages de dates de publication

Ce site montre comment les efforts de copywriting et de référencement de ces dernières années ont produit des pages avec des profils optimisés ou identiques à travers des métriques de page (ici le nombre de mot). Cependant, les pages plus anciennes de ce site ont beaucoup plus de variation dans le nombre de mots et dans l’optimisation de la page en général.

La date de publication peut être liée aux problèmes de gestion du contenu dupliqué

Une connaissance accrue du SEO a permis à l’équipe de ce site de produire de nouveaux contenus uniques ou correctement canonisés, réduisant de deux tiers le nombre d’erreurs dans la stratégie de duplication de contenu sur la période de 2015 à 2018.

 

Rebecca Berbel Voir tous ses articles
Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :