Pourquoi les SEOs doivent abandonner Excel au profit du SQL ?

12 novembre 2019 - 6  min de lecture - par Tom Donohoe
Accueil > SEO Technique > Pourquoi les SEOs doivent abandonner Excel

Une grande partie de l’industrie SEO utilise Excel pour analyser ses données, ce qui n’est pourtant pas la meilleure méthode.

En tant que référenceur, la quantité de données auxquelles nous sommes exposés augmente considérablement chaque année. Excel devient alors de moins en moins efficace au vu de sa limite de 1 million de lignes par classeur.

En outre, la façon dont les données sont traitées dans les feuilles de calculs rend les analyses SEO lentes et fastidieuses. Les analyses affectent les données et sont difficiles à répéter ainsi qu’à partager.

C’est pourquoi je recommande à tous les experts SEO de passer maintenant par le SQL (ou Python).

Quelles sont les limites d’Excel ?

Si vous avez déjà utilisé un tableur, vous savez que :

  • Il est facile de modifier accidentellement un élément qui va bouleverser vos données.
  • Il est difficile de reproduire une ancienne analyse sur de nouvelles données.
  • Il est fastidieux de travailler lorsque l’ensemble des données contient quelques centaines de milliers de lignes.
  • Il est difficile de partager d’importantes feuilles de calculs avec d’autres personnes.

Pourquoi passer d’Excel au SQL ?

Si vous passez d’Excel au SQL, tous les problèmes que j’ai mentionnés précédemment seront de l’histoire ancienne en plus de vous accorder quelques avantages :

  1. Le SQL est plus rapide qu’Excel. Ce qui prend quelques heures dans Excel peut être complété en quelques minutes en SQL.
  2. Le SQL sépare l’analyse des données. Lorsque vous utilisez le SQL, les données que vous analysez sont stockées séparément. Concrètement, cela signifie que vous pouvez envoyer à vos collègues un petit fichier de code pour accéder à votre analyse. Ils peuvent ré-exécuter l’analyse sans détruire vos données et tout votre code est réutilisable.

Qu’est-ce que le SQL ?

Le SQL est le langage standard utilisé pour extraire et analyser les données stockées dans les bases de données.

Voici un exemple de syntaxe SQL :

Vous pouvez comprendre cette syntaxe SQL sans même connaître le langage :

  1. Sélectionne toutes les colonnes
  2. À partir d’un tableau (source de données)
  3. Lorsqu’une colonne est égale à « une certaine valeur ».

C’est la même chose que l’ajout d’un filtre dans Excel.

Pourquoi les SEOs devraient apprendre le SQL ?

Le SQL permet de traiter plus de données. Les référenceurs, et particulièrement les référenceurs dit “techniques”, trouvent une vraie valeur ajoutée dans les grosses bases de données ainsi que dans la combinaison de ces mêmes bases. Par exemple, si vous pensez aux fichiers de log, aux données de crawl ou à d’autres ensembles de données techniques, ils dépassent tous la limite d’Excel.

Pour traiter ces données, nous devons utiliser un outil conçu pour analyser en grande quantité. Le SQL est justement un excellente élève en la matière !

Tout comme Excel, le SQL permet de créer un ensemble de données et de mettre en place de nouvelles colonnes à l’aide de fonctions agrégées ou conditionnelles qui facilitent la gestion. Cependant, le SQL utilise une logique plus proche de la programmation, ce qui en fait également une bonne introduction à l’aspect technique des choses. Évidemment, cela s’applique aux référenceurs qui souhaitent améliorer leurs compétences techniques.

Applications pratiques de SQL pour les professionnels du SEO technique

Maintenant, je vais partager quelques exemples où le SQL surpasse Excel pour l’analyse des données SEO.

Avant de commencer, n’oubliez pas que pour utiliser le SQL, vous devez avoir nécessairement une base de données.

Ceci n’est pas un guide pour réussir à utiliser le SQL, en revanche, voici quelques conseils :

Communiquez avec votre équipe data et voyez ce qu’elle a déjà en stock en interne.
Ou faites-le vous-même en suivant ce guide sur Moz : « Comment utiliser une grande requête pour un référencement à grande échelle ».

Analyse des fichiers de log

Les fichiers de log sont un sujet big data. Les fichiers de log dépassent facilement 1 million de lignes, vous ne pourrez donc pas analyser les données dans Excel sans échantillonnage. Et l’échantillonnage peut malheureusement introduire des erreurs.

Cependant, si vous avez les données dans une base de données (comme Big Query), vous pouvez les analyser à l’aide du SQL.

Voici quelques questions courantes auxquelles le SQL peut répondre :

  • À quelle fréquence Googlebot visite mon site Web ?
  • Quel Googlebot parcourt mon site ?
  • Quel est le % de requête qui n’ont pas répondu aux 200 demandes ?
  • Quel est le % de requêtes pour chaque répertoire ou section du site ?

Sur mon blog, j’ai couvert en détail ce sujet donc si vous voulez l’installer dans une base de données, consultez ce guide par Distilled sur les fichiers de log.

Analyse des données de crawl

Si vous crawlez de gros sites web, ils dépasseront facilement la limite d’un million de lignes Excel par classeur.

Même les sites Web qui n’ont théoriquement que quelques milliers d’URL peuvent atteindre des millions de lignes en raison d’une mauvaise implémentation, d’une mauvaise utilisation des paramètres ou encore de nombreuses autres raisons.

Le SQL vous permet d’analyser l’ensemble des données d’un logiciel de crawl, tel qu’Oncrawl, sans échantillonner les données. Cela signifie que vous pouvez utiliser les logiciels à leur plein potentiel sans avoir à vous soucier de la façon dont vous allez les analyser dans Excel.

Analyse Google Analytics

Si vous avez déjà travaillé avec un site qui reçoit plus de 5 visites par mois, vous avez probablement trouvé Google Analytics très lent..

L’utilisation du SQL pour analyser les données peut accélérer les choses, de sorte que vous n’avez pas à naviguer lentement dans l’interface utilisateur et à attendre le chargement des données.

Tout comme avec les autres sources de données, le SQL vous permet d’analyser vos données Google Analytics sans échantillonnage et peut vous faire économiser 250 000 $ sur la mise à niveau vers le premium.

Analyse de la Search console

Les données dans l’interface de la Google Search Console sont excellentes, mais pour filtrer / personnaliser les données, vous n’avez pas beaucoup d’options.

Il est préférable d’exporter les données dans Excel, mais pourquoi ne pas aller plus loin et les analyser avec le SQL !

Un syllabus pour les experts SEO afin d’apprendre le SQL

Le SQL pour l’analyse des données SEO n’est pas compliqué. C’est beaucoup plus facile à collecter qu’avec Excel.

Pour les besoins du référencement, vous devriez vous concentrer sur l’apprentissage des des fonctions suivantes: :

  • SELECT et FROM
  • COMMENTS
  • LIMIT
  • WHERE
  • Comparison Operators
  • Logical Operators
  • ORDER BY
  • GROUP BY
  • AGGREGATE FUNCTIONS
  • CASE
  • JOIN

Tout d’abord, je recommande de suivre le cours SQL for Data Analysis sur Udacity.

Passez ensuite au tutoriel SQL de Mode Analytics. Vous pouvez appliquer vos connaissances du cours Udacity grâce à leur base de données publique.

Enfin, vous pouvez également pratiquer en suivant un cours sur Codecademy ou Datacamp.

Chacune de ces plateformes comporte des défis pratiques que vous pouvez utiliser et ajouter à votre portefeuille.

Ressources utiles :

L’essentiel, c’est que si vous voulez rester en tête du peloton en tant que référenceur, il est temps que vous commenciez à peaufiner vos compétences en analyse avec des outils comme le SQL et Python.

Le SQL est un excellent point d’entrée, facile à prendre en main et vous donnera une bonne introduction au code. Une fois que vous avez bien acquis l’utilisation du SQL, vous pouvez commencer à apprendre Python.

Tom est consultant SEO chez Tom Donohoe Consulting. Il a développé le SEO de grandes marques australiennes. Il est un grand évangéliste de tout ce qui est numérique, un amoureux du SEO technique, un féru de données et un contributeur fréquent à différents blogs. Suivez Tom sur Twitter où sur son site web : https://www.tomdonohoe.com.au
Sujets en lien :