Ingesting-and-cross-analyzing-analytics-data-in-Oncrawl-250px

L’ingestion et l’analyse croisée des données analytiques dans Oncrawl

27 juin 2023 - 9  min de lecture - par Rebecca Berbel
Accueil > SEO Technique > L'ingestion et l'analyse croisée des données

Les données analytiques apportent un éclairage important à l’analyse SEO technique : elles permettent de contextualiser et de hiérarchiser les priorités en révélant la relation entre le SEO technique et le comportement des utilisateurs qui ont trouvé votre site par un canal organique.

Si vous souhaitez croiser l’analyse des données techniques SEO et des données analytiques dans Oncrawl, vous êtes au bon endroit ! Si vous avez migré vers GA4, ou si vous utilisez Piano (AT Internet) ou Adobe Analytics, vous pouvez utiliser nos connecteurs natifs.

Mais qu’en est-il si votre site utilise un autre outil, comme Matomo ou Plausible.io ? Ne vous inquiétez pas : vous pouvez toujours utiliser les métriques analytiques de la solution que vous utilisez pour croiser vos données dans Oncrawl.

Voici comment procéder en utilisant l’ingestion de données :

  1. Tout d’abord, nous commencerons par exporter les bonnes informations depuis votre solution d’analyse – nous utiliserons Matomo comme exemple.
  2. Nous verrons comment formater l’export pour l’ingestion de données.
  3. Nous intégrerons cet export dans Oncrawl et l’associerons à un crawl.
  4. Nous verrons aussi comment analyser les données dans Oncrawl.
  5. Enfin, nous suggérerons quelques moyens d’automatiser le processus.

Exporter des données à partir d’une solution analytique

Dans Matomo, ce que vous recherchez, ce sont les pages sur lesquelles les visiteurs cliquent à partir des pages de résultats d’un moteur de recherche (SERP), en d’autres termes, les pages d’atterrissage. Le rapport se trouve sous Behavior (Comportement) > Landing pages (Pages d’atterrissage).

Exporting data_Matomo

Comme je ne m’intéresse qu’aux visiteurs provenant de la SERP, je souhaite examiner spécifiquement un segment de visites provenant d’un moteur de recherche.

Si vous ne l’avez pas encore configuré, voici à quoi cela devrait ressembler : j’ai filtré par Acquisition channel (Canal d’acquisition) > Search (Recherche). J’ai appelé ce segment « visites SEO », mais vous avez peut-être un nom différent pour le vôtre.

Acquisition channel - Search_Matomo

Je vais procéder à une analyse croisée avec les données de crawl. Pour obtenir des résultats similaires à ceux des connecteurs analytiques Oncrawl, j’utiliserai la même période de 45 jours avant le crawl.

Date selection_Matomo

Je peux maintenant exporter ce rapport. Assurez-vous que vous exportez le rapport complet, et pas seulement les 100 premières lignes.

Data export-Matomo

Parfait ! Il ne nous reste plus qu’à préparer le fichier CSV.

Préparer un fichier CSV pour l’ingestion de données dans Oncrawl

Nous allons effectuer trois changements importants :

  • Supprimer les données dont nous n’avons pas besoin.
  • Renommer les colonnes pour éviter les erreurs et rendre ce processus reproductible, puisque ces noms deviendront les noms de vos métriques ou champs dans Oncrawl.
  • Veiller à ce que les nombres soient formatés comme des nombres et non comme des caractères de texte.

Lorsque j’ouvrirai ce fichier dans Excel, je devrai le convertir. Je peux le faire sous Data (Données) > Text to columns (Texte en colonnes). Un fichier CSV est « délimité », ce qui signifie que les champs sont séparés par un caractère spécifique, dans ce cas, une virgule.

Preparing a CSV file for data ingestion

Les principales données que je souhaite conserver, si je veux obtenir les mêmes informations que l’ancien Oncrawl Google Analytics (Universal Analytics), seront l’URL, le nombre d’entrées (Colonne W) et le taux de rebond (Colonne AM).

A noter : vous avez la possibilité de conserver des données supplémentaires en fonction de vos besoins ou objectifs spécifiques. Pour notre exemple, je vais supprimer tout le reste.

Maintenant, je vais renommer les colonnes. La première colonne contenant l’URL doit s’appeler « URL ». Les autres titres de colonnes ne peuvent pas contenir d’accents, de caractères spéciaux ou d’espaces. Nommons-les « SEO-sessions » et « Bounce-rate ». Ce seront les noms de mes champs dans Oncrawl.

Tout d’abord, je vais ajouter le domaine à mes pages d’atterrissage. J’ai fait cela avec la formule « =CONCAT(« https://your-domain.here »;A2) », puis j’ai collé le texte seul (utilisez « Coller spécial » dans Excel) du résultat sur les chemins de la page d’atterrissage.

Ensuite, je vais reformater les colonnes contenant des chiffres en valeurs numériques. En cliquant avec le bouton droit de la souris, je peux choisir « Formater les cellules ». Je choisirai « nombre » pour cette colonne – il s’agit de nombres entiers, je supprimerai donc les décimales automatiques.

Le taux de rebond est un peu plus compliqué. L’idée est d’exprimer les pourcentages sous forme de valeurs décimales. Si votre taux de rebond est formaté comme suit : un nombre, un espace, puis un signe de pourcentage, une façon de le faire est de :

  • Supprimer l’espace à l’aide de la fonction recherche et remplace.
  • Formatez la colonne en pourcentage.
  • Puis reformater la colonne en nombre décimal avec deux décimales.

A noter : Si, comme moi, votre ordinateur vit dans une région où les décimales sont séparées par une virgule au lieu d’un point, vous devrez remplacer la virgule par un point.

Formatting CSV file

Enregistrez le fichier. Nous l’appellerons Matomo, suivi de la date du jour, et nous choisirons le format CSV UTF-8 (délimité par des virgules).

Matomo_CSV UTF-8 file

Nous pouvons maintenant le zipper et l’importer dans Oncrawl.

Ingérer des données dans Oncrawl

Depuis la page de votre projet, cliquez sur « Add data sources » et passez à l’onglet « Data ingestion ». Glissez et déposez votre fichier Matomo zippé ici.

Une fois traité, vous devriez le voir ici.

Ingesting data in Oncrawl

Nous pouvons maintenant passer à la configuration du crawl pour votre profil d’ingestion analytique. Sous “Data ingestion”, choisissez le fichier que vous venez de télécharger. 

Attention cependant : comme vos données analytiques changent à chaque extraction, vous devez vous assurer de mettre à jour ce fichier avant chaque extraction.

Enfin, enregistrez et lancez l’analyse.

Setting up a new crawl

Analyser des données analytiques ingérées

Lorsque le crawl est terminé, vous pouvez consulter vos données d’analyse dans les différents outils de la plateforme :

  • “URL Details”, qui répertorie toutes les informations collectées par Oncrawl pour une seule URL.
  • “Data Explorer”, qui vous permet de créer des rapports détaillés basés sur n’importe quelle mesure de la plateforme Oncrawl.

Oncrawl data explorer_1

Oncrawl data explorer_2

Il est important de préciser que vous pouvez pousser les analyses beaucoup plus loin en croisant vos données analytiques avec les données de crawl. Pour ce faire, une fois le crawl terminé, vous devrez créer au moins une segmentation pour visualiser les données dans les graphiques Oncrawl.

C’est l’un des seuls moment où vous devrez attendre la fin du crawl avant de créer une segmentation, car nous ne savons pas comment vous avez appelé vos champs – ni même quels champs vous avez choisi d’ingérer – tant que nous n’avons pas traité l’analyse du crawl.

C’est également la raison pour laquelle il est important de toujours nommer vos colonnes de la même manière à chaque fois que vous effectuez cette opération. Cela vous permettra de continuer à utiliser exactement les mêmes segmentations pour toute analyse incluant ce type de données analytiques ingérées.

Voici quelques exemples de segmentations dont vous aurez besoin si vous souhaitez obtenir des données similaires à celles que vous obtiendrez en utilisant les connecteurs analytiques natifs d’Oncrawl :

  • Dans cette première segmentation, j’ai recréé le groupement standard par plage de visites SEO : 0 visites, 1-9 visites, 10-99 visites, etc. Il s’agit d’une segmentation par URL, pendant la période de 45 jours que j’ai choisie plus tôt pour l’exportation Matomo.
    Oncrawl Analytics SEO Sessions
  • Dans la seconde segmentation, j’ai créé deux catégories : les pages SEO actives, qui ont n’importe quelle valeur dans ce nouveau champ de session – autre que 0 – que ce soit 1 ou 10 000 ; et les pages inactives, qui sont les pages qui ne sont pas apparues dans l’exportation Matomo.Oncrawl Analytics Active Pages
  • Vous pouvez également créer une segmentation en classant les pages par taux de rebond.

Examinons quelques-uns des graphiques existants que nous pouvons recréer à l’aide de ces segmentations. Oncrawl fournit beaucoup d’informations en mélangeant les sessions et les pages actives avec d’autres métriques sur la plateforme :

  • Profondeur
  • Inrank
  • Inlink
  • Évaluation des balises
  • Nombre de mots
  • Évaluation du contenu dupliqué
  • Évaluation du temps de chargement
Sessions by depth and SEO active pages by depth

Sessions par profondeur et pages actives SEO par profondeur : Google Analytics – Connecteur UA

 

Tous ces éléments – et bien d’autres encore – sont compatibles avec ces segmentations. Voici un exemple de ce que cela donne avec des données ingérées.

Oncrawl_Page groups by depth

Sessions by depth and active pages by depth

Sessions par profondeur et pages actives par profondeur – ingestion Matomo avec segmentation et tableau de bord personnalisé

 

Vous pouvez télécharger ces tableaux de bord personnalisés à la fin de l’article – il y en a un pour les sessions avec une segmentation « SEO Sessions », et un pour les pages actives avec une segmentation « Active Pages ». Vous devrez mettre à jour les segmentations pour qu’elles correspondent aux vôtres.

Vous pouvez également utiliser le Data Explorer pour trouver des mesures et les enregistrer en tant que “Own Filters”/filtres personnalisés. Voici quelques exemples d’informations que vous pouvez trouver dans le Data Explorer mais qui ne sont pas affichées dans les tableaux de bord personnalisés :

  • Le nombre total de visites SEO.
  • Le nombre de visites provenant de pages SEO orphelines.
  • Le nombre moyen de sessions par page active.
  • Le nombre de pages actives renvoyant un message 404.

Vous reconnaîtrez bon nombre de ces données dans le tableau de bord récapitulatif du “SEO impact report”.

Data Explorer to compare SEO session values from Matomo

Utilisation du Data Explorer pour comparer les valeurs des sessions SEO provenant de Matomo (données utilisateur ingérées), de GA-UA et des données de logs.

 

Automatiser l’import et l’analyse croisée des données analytiques dans Oncrawl

Enfin, si vous souhaitez procéder à des analyses régulières, vous souhaiterez probablement automatiser tout ou partie de ces étapes. Voici quelques pistes pour commencer :

  • Matomo dispose d’une API qui peut être utilisée pour obtenir les données exportées de manière programmatique. Vous trouverez la documentation de l’API sur le site web de Matomo (https://developer.matomo.org/api-reference/reporting-api#Live).
  • Les scripts – ou même les macros – peuvent être très utiles lorsque vous avez une séquence d’actions comme celles que nous venons d’effectuer sur la feuille de calcul.
  • Vous pouvez utiliser l’API d’Oncrawl pour mettre à jour votre profil de crawl, puis lancer un nouveau crawl. Si vous êtes un utilisateur de l’API et que vous travaillez sur ce sujet, contactez votre expert SEO et nous partagerons avec vous un exemple de cahier de codes.
  • Vous pouvez également programmer ces étapes pour qu’elles soient exécutées régulièrement.

Obtenir des résultats SEO grâce au comportement utilisateur

C’est là tout l’intérêt de l’analyse de données : s’assurer que les changements que nous apportons aux sites web ont un impact sur le comportement des utilisateurs, comme nous l’avions prévu.

La fonction d’ingestion de données d’Oncrawl garantit que les données d’analyse provenant de n’importe quelle source peuvent être mélangées avec les données techniques de référencement collectées nativement sur la plateforme.

Elle peut également être utilisée pour ajouter des mesures – par exemple, des mesures personnalisées dans GA4 – qui ne sont pas incluses par défaut dans les connecteurs d’Oncrawl.

Une fois que vous aurez compris comment les données SEO techniques et le comportement organique des utilisateurs sont liés, vous serez capable de déterminer quels projets SEO peuvent avoir le plus d’impact sur les utilisateurs.

(Et n’oubliez pas de télécharger gratuitement les segmentations et les tableaux de bord Oncrawl)

Rebecca Berbel Voir tous ses articles
Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :