5 techniques pour améliorer votre analyse de log SEO avec l’intégration Splunk d’Oncrawl

15 janvier 2019 - 7  min de lecture - par Rebecca Berbel
Accueil > SEO Thoughts > 5 techniques pour améliorer votre analyse de log SEO avec l’intégration Splunk d’Oncrawl

Oncrawl a récemment sorti une intégration Splunk pour faciliter le monitoring de log des utilisateurs Splunk. Les entreprises utilisent notre intégration Splunk pour deux raisons principales : l’automatisation de la procédure et le contrôle de sécurité élevé. Mais les avantages de l’outil ne s’arrête pas ici. Voici 5 techniques pour utiliser l’intégration Splunk afin d’améliorer votre SEO Technique.

Analyse de log SEO : les basiques

Qu’est-ce que l’analyse de log SEO ?

Vos fichiers de log représentent toute l’activité enregistrée sur votre site web par votre serveur. C’est la source d’information la plus complète et fiable pour savoir ce qu’il se passe sur votre site. Ceci inclut le nombre et la fréquence de visites de bot, de visites SEO en provenance des SERPs, la répartition par type d’appareils (desktop vs. mobile) ou par type d’URL (page vs. ressource), les tailles précises des pages et les status codes HTTP.
Voici quelques uns des nombreux avantages de l’analyse de log SEO :

  • Repérer les pics ou changements dans le comportement de crawl qui indique des modifications dans la manière dont votre site est géré par Google ;
  • Connaître le temps moyen nécessaire pour que vos nouvelles pages soient indexées et reçoivent leurs premières visites organiques ;
  • Surveiller comment l’activité des bots et des utilisateurs affecte le classement d’une page ;
  • Comprendre comment le comportement des bots et de l’utilisateur est corrélé avec d’autres facteurs SEO.

Qu’est-ce que Splunk ?

Splunk est une solution d’agrégation de données. Capable d’indexer et de gérer des données de multiples sources à l’échelle, la solution inclut des fonctions de traitement de logs, de sécurité et de reporting.
Quelques uns des avantages de Splunk :

  • Indexer et rechercher des corrélations de données améliorées ;
  • Sonder et pivoter des capacités pour de meilleurs reportings ;
  • Alertes en temps réel ;
  • Dashboards de données ;
  • Scalabilité ;
  • Options de déploiement flexibles.

Monitoring de log dans Splunk

Les utilisateurs de Splunk bénéficient de l’intégration d’Oncrawl pour connecter les données de serveur de log gérées dans Splunk avec les données SEO de la plateforme Oncrawl.

Améliorer votre SEO technique avec Oncrawl + Splunk

1. Utiliser les logs pour des analyses SEO en profondeur

Splunk a prouvé sa capacité à agréger, chercher, monitorer et configurer des alertes pour les données de log. La solution analyse et indexe le contenu dans les serveurs de logs. Grâce à sa puissante capacité de recherche et de filtres, Splunk fournit des réponses aux questions concernant les données dans vos fichiers de log. Cette étape de traitement fournit des statistiques sur les tendances révélées dans les données de log.
Cependant, lorsque vous souhaitez appliquer cela à vos données SEO, il est mieux de commencer avec les données brutes. Et c’est exactement ce que l’intégration Splunk d’Oncrawl permet.
Au lieu de juste présenter des statistiques séparées provenant des données de log, celle-ci vous permet d’intégrer les informations de vos logs avec n’importe quelle autre source données présente dans la plateforme Oncrawl. Vous pourrez ainsi examiner les relations entre les métriques SEO et les informations sur le comportement de l’utilisateur et du bot issues de vos fichiers de log.

Nombre de visites organiques par profondeur de page.

Cette analyse croisée peut inclure des axes utiles pour le SEO :

  • Le comportement de crawl réparti par bots individuels ;
  • Le temps entre le premier crawl et la première visite organique ;
  • La comparaison entre les pages rendues aux utilisateurs et celles rendues durant un crawl d’audit ;
  • La découverte des pages orphelines ;
  • Les corrélations entre la fréquence de crawl, les classements, les impressions, et le CTR ;
  • L’influence de la stratégie de maillage interne sur l’activité de l’utilisateur/du bot ;
  • La relation entre la profondeur d’une page et l’activité de l’utilisateur/du bot ;
  • La relation entre la popularité interne d’une page et l’activité de l’utilisateur/du bot ;
  • La répartition de l’activité de l’utilisateur et du bot à travers les pages groupées par performance SEO ;

2. Faciliter la configuration

Que vous ayez besoin ou non d’automatisation ou de contrôles plus fins concernant la sécurité des données, si vous êtes un utilisateur Splunk, vous allez forcément apprécier la facilité de la configuration.
Si vous n’êtes pas un administrateur système, la configuration du monitoring de log pour le SEO peut sembler être une tâche compliquée.
Notre suggestion est de simplement sauter les parties difficiles. Vous pouvez maintenant tout paramétrer directement dans Splunk et utiliser la clef que vous avez générée pour créer la connexion avec Oncrawl.
Et c’est tout. Vous êtes prêt. Ça ne pouvait pas être plus simple !

Oncrawl Analyseur de logs

L’analyse des fichiers de logs SEO pour le suivi des bots et l’optimisation du crawl. Identifiez les problèmes sur votre site et améliorez votre fréquence de crawl.

3. Tirer profit de l’automatisation du traitement avec Splunk

Le traitement manuel de l’utilisation des données de log collectées dans Splunk requiert plusieurs étapes :

  • Créer des filtres pour chercher les bonnes sélections de données de log ;
  • Créer des recherches sauvegardées ;
  • Paramétrer l’automatisation pour lancer des recherches ;
  • Exporter en CSV ;
  • Connecter à votre occurrence Splunk dans SSH ;
  • Naviguer vers votre dossier de sortie CSV ;
  • Transférer le fichier de votre ordinateur ;
  • Se connecter à l’espace FTP Oncrawl ;
  • Transférer le fichier vers Oncrawl…

Cette procédure doit être répétée régulièrement pour éviter des oublis dans vos données de log. Souvent, cela devient une tâche quotidienne.
Si vous choisissez d’utiliser l’intégration Splunk d’Oncrawl, vous n’aurez plus besoin de lancer cette tâche régulièrement. Vous aurez juste à paramétrer le traitement (et, comme mentionné précédemment, ce paramétrage est très simple). Vous n’aurez plus besoin de vous préoccuper de lancer un script, ou pire, une série d’actions manuelles chaque jour : l’intégration s’en occupera pour vous.

4. Protéger le traitement de données

Protégez-vous de la perte de données en cas de problème. Parce que le monitoring de log s’appuie sur un flux continu de données, les écarts peuvent générer des conclusions incorrectes. Vous ne devriez pas avoir à vous poser des questions comme : est-ce que l’apparente absence de visites organiques ce matin est due à quelque chose qui s’est produit dans Google ou est-ce que je suis juste passé à côté de données ?
L’intégration Splunk d’Oncrawl vous protège si votre serveur est en panne ou si la connexion est perdue et anticipe les erreurs humaines lorsque vous n’avez pas le temps ou que vous oubliez simplement de télécharger des données. Si vous ne pouvez pas vous connectez au serveur, cela ne causera pas d’écart dans vos données, nous les collecterons juste un peu plus tard. Si vous trouvez une série de données d’une précédente date que vous avez oubliée d’ajouter à Splunk, l’intégration d’Oncrawl la récupérera automatiquement.

5. Prenez le contrôle de la sécurité des données

Chez Oncrawl, nous prenons la sécurité de vos données très sérieusement.
Comme toujours, les données sensibles dans vos logs sont gardées dans votre espace privé et sécurisé et ne sont disponibles nulle part ailleurs. Par exemple, les seules données personnelles que nous traitons sont les adresses IP lorsque nous validons l’authenticité des visites Googlebot. Nous ne gardons aucune trace des adresses IP utilisées, seulement le résultat de la validation. Si nécessaire, vous pouvez retirer les informations sensibles rendues disponibles pour l’analyse à n’importe quel moment en retirant les fichiers de votre espace FTP.
L’intégration de Splunk va encore plus loin. Nous nous assurons que vous maintenez le contrôle sur vos données durant tout le traitement. Vous définissez les droits d’accès, les données qui seront partagées et la fréquence des mises à jour dans Oncrawl. Lorsque vous partagez des données avec Oncrawl à travers l’intégration Splunk, nous utilisons des protocoles standards et sécurisés pour communiquer avec Splunk, protégés par un mot de passe et une clef que vous aurez configurés.
Comme le paramétrage est effectué dans Splunk, Oncrawl ne voit jamais rien dont vous n’auriez pas autorisé l’accès. Vous choisissez les informations que vous souhaitez partager avec Oncrawl. En plus de cela, comme vous gérez toute la configuration, s’il y a des changements dans votre procédure d’authentification ou dans les standards de votre entreprise, vous pouvez faire ces changements vous-même à n’importe quel moment.

Rebecca Berbel Voir tous ses articles
Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :