Comment mesurer et optimiser votre présence dans les recherches IA

How-to-measure-success-in-AI-search-250px
Share :
Accueil > IA > Optimisez votre présence dans les recherches IA

La recherche IA soulève de nombreuses questions : comment la tracker ? Lesquels des prompts fonctionnent pour votre site ou votre marque ? Quel est l’impact du fan-out des requêtes ? Les questions semblent infinies et les réponses souvent contradictoires. Cependant, en filtrant toutes les informations superflues, il est possible de trouver des réponses fiables. Il suffit de savoir quelles approches fournissent réellement des données fiables.

Je me suis vraiment intéressé à la manière dont fonctionne la recherche IA et à l’analyse des données réelles dont nous disposons pour répondre à ces questions. Dans cette série, mon objectif est de rendre la mesure de la recherche IA aussi transparente que possible.

Dans mon précédent article, « Les bots IA expliqués : qu’est-ce qui alimente les plateformes telles que ChatGPT ? », j’ai conclu que

“L’obtention de données de recherche fiables issues de l’intelligence artificielle reste l’un des principaux défis auxquels sont confrontés les professionnels du SEO aujourd’hui. L’analyse des logs offre une solution en fournissant le field data les plus fiables actuellement disponibles pour comprendre le comportement des plateformes d’IA.”

Cela nous amène à la question suivante : comment mesurer efficacement le succès de la recherche IA ?

Dans cet article, nous examinerons comment transformer les visites des bots utilisateurs IA en métriques de recherche IA fiables et pourquoi cette approche est la plus sûre à ce jour.

Le challenge des données de recherche IA

Bien que le trafic de référence IA soit déjà en baisse et n’apporte pratiquement aucun clic, cela ne signifie pas qu’il est inutile d’investir dans la recherche IA et de l’optimiser.

Le parcours utilisateur évolue. ChatGPT, Perplexity, Claude et d’autres plateformes d’IA répondent directement aux questions, en citant souvent leurs sources au lieu de renvoyer les utilisateurs vers les résultats de recherche traditionnels. Cependant, le parcours ne s’arrête pas là. Un client potentiel peut découvrir votre marque dans ChatGPT et effectuer ensuite une recherche sur vos produits dans Google. Vous devez être visible dans les deux cas.

Cela signifie que votre objectif est d’être visible dans la recherche IA, et non pas d’obtenir du trafic de référence.

Le défi réside toutefois dans le fait que les plateformes LLMs telles que ChatGPT ne fournissent actuellement pas de mesures de recherche (sauf si vous avez un partenariat) comme le fait Google. C’est une boîte noire.

Dans le cadre du SEO, avant que votre site web ne génère des clics, vous pouvez suivre les impressions et le positionnement pour voir si vous progressez. Plus important encore, vous pouvez cibler des mots-clés en fonction du volume de recherche.

Rien de tout cela n’est disponible pour la recherche IA, vous ne disposez que des clics. Cependant, il existe une arme secrète dont j’ai déjà parlé : le trafic des bots utilisateurs IA dans les logs de votre serveur.

Je suis convaincu que l’analyse des logs est actuellement le seul moyen fiable de mesurer la performance de visibilité dans les LLMs.

[Ebook] Crawling & les fichiers de logs : cas pratiques et conseils basés sur l’expérience

Un regard approfondi sur l’importance de l’analyse des fichiers logs et du comportement des crawls.

Comprendre la différence entre le lab data et le field data

Si la recherche IA est une boîte noire de données, la première étape consiste à comprendre ce que vous pouvez réellement mesurer.

En réalité, les professionnels du SEO ont accès à deux types de données : le lab data le field data.

Le lab data proviennent d’outils de prompt tracking qui testent des requêtes spécifiques pour voir si et comment votre marque apparaît dans les réponses IA. Cette approche est utile pour comparer votre marque à celle de vos concurrents et réaliser du monitoring des mentions de votre marque sur différentes plateformes. Cependant, comme elle repose sur des prompts simulés plutôt que sur des requêtes réelles d’utilisateurs, elle ne peut pas vous renseigner sur le volume de trafic réel ou le retour sur investissement.

Le field data, en revanche, proviennent de l’analyse des logs de votre serveur afin de suivre le comportement réel des bots IA. Elles vous indiquent quelles pages les plateformes IA crawlent, citent et vers lesquelles elles envoient du trafic. C’est la différence entre tester ce qui pourrait se produire et mesurer ce qui se produit réellement.

Le tableau ci-dessous présente les différences entre ces deux types de données :

Le lab dataLe field data
DéfinitionDonnées synthétiques issues de simulations de l’utilisation de l’IA/LLMDonnées réelles issues de l’utilisation effective de l’IA/LLM
Indicateurs
  • Mentions de la marque
  • Références sur le site web
  • Fan-out des requêtes
  • Analyse des sentiments
  • Visites des bots utilisateurs de l’IA
  • Visites de référence de l’IA
  • Sessions de référence de l’IA
Fonctionnement
  • Définir un ensemble de prompts
  • Effectuer le scraping de l’API LLM ou de l’application web LLM
  • Analyser les résultats
  • Collecter les logs du serveur
  • Analyser les fichiers
Utile pour
  • Optimisation off-page
  • Benchmarking
  • Compréhension de la perception des sujets par le LLM
  • Identification des sources fiables
  • Optimisation on-page
  • Progression de la visibilité
  • Mesure de la couverture et de l’impact
Avantages
  • Compréhension approfondie de la visibilité LLM
  • Véritable indicateur du volume de visibilité
  • Permet de mesurer le succès de la visibilité
Inconvénients
  • Ne mesure pas le succès réel
  • Biais des données dû à la personnalisation
  • Les prompts et QFO ne sont pas disponibles

 

Idéal pourPositionnement concurrentiel et monitoring de la marqueSuivi des performances et optimisation technique

Quand le prompt tracking est pertinent

Les outils de suivi rapide sont utiles lorsque vous devez suivre les objectifs liés aux médias que vous possédez et aux relations publiques. Si vous avez besoin de comparer la visibilité de votre marque à celle de vos concurrents ou de réaliser du monitoring sur la manière dont votre marque est mentionnée et citée sur les plateformes d’IA, le prompt tracking fournit des informations précieuses.

Il est particulièrement utile pour suivre le sentiment et comprendre quelles sources les plateformes d’IA associent à votre marque.

Quand l’analyse des logs est pertinente

Comme indiqué dans mon précédent article, les visites des bots utilisateurs d’IA peuvent être utilisées comme indicateur de visibilité dans les recherches IA : un indicateur indirect des citations (ou impressions).

1 visite d’un bot utilisateur = 1 citation potentielle

Chaque visite d’un bot ChatGPT-User sur votre site web représente une tentative de lecture de votre contenu en vue d’une citation. Cela ne garantit pas que la source ait été effectivement utilisée dans la réponse à une requête d’un utilisateur, mais cela confirme que la page figurait dans la liste des sources.

La recherche ChatGPT a sélectionné cette page parmi d’autres résultats de recherche comme une source fiable susceptible de contenir les informations nécessaires pour répondre à la requête.

Les limites à prendre en compte

Tous les accès de bots ne garantissent pas que la page générera une citation. Plusieurs facteurs peuvent empêcher cela :

 

  1. Redirections – Les visites des bots sur les pages de redirection ne génèrent pas de citations.
  2. Erreurs de code statut – Les erreurs serveur (500) ou client (404) bloquent l’accès.
  3. Contenu manquant – Les pages avec un contenu mince ou inexistant ne peuvent pas être citées.
  4. Pages riches en JS – Le contenu derrière JavaScript peut ne pas être lisible par les bots.

 

De plus, les chatbots LLM utilisent un système de mise en cache, ce qui signifie qu’ils n’effectuent pas systématiquement un crawl pour chaque requête utilisateur. Lorsqu’une page est en cache, le LLM n’a pas besoin d’envoyer un bot utilisateur IA pour lire le contenu qu’il souhaite inclure comme citation. Par conséquent, une partie de la visibilité ne peut pas être mesurée à l’aide des logs.

Cependant, les données et les tests actuels montrent que l’activité des bots utilisateurs IA a augmenté depuis la sortie de ChatGPT-5. Le système de mise en cache semble avoir plus d’impact dans le contexte d’une conversation utilisateur que dans celui d’un système de mise en cache global. Les données des logs restent un moyen fiable de mesurer la visibilité de l’IA malgré cette lacune.

Il convient également de garder à l’esprit que les bots utilisateurs IA peuvent explorer plusieurs pages de votre site web pour une seule « session de prompt ». Il s’agit d’un cas marginal, mais cela pourrait artificiellement gonfler le volume de citations pour les prompts liés à la marque.

L’approche d’Oncrawl

Oncrawl vient de lancer le nouvel feature AI Search Lens, conçu pour mesurer et analyser la manière dont les LLMs interagissent avec votre site web, sur la base de données réelles de crawl et de logs. Afin de contourner certaines des limitations mentionnées ci-dessus, nous filtrons par défaut les codes statut 200 et 304 afin de ne conserver que les visites des bots utilisateurs d’IA susceptibles de générer une citation.

Pour compléter cette approche, nous proposons à nos utilisateurs une segmentation et un filtrage OQL (Oncrawl Query Language) personnalisé dans l’application, afin qu’ils puissent ajouter leurs propres règles de filtrage :

  • Filtrage par nombre de mots
  • Type de page à exclure en raison de sa faible qualité ou de sa forte dépendance à JS

Les logs représentent l’approche la plus efficace pour mesurer la visibilité des recherches IA disponibles aujourd’hui. Bien qu’ils ne capturent pas 100 % des citations, ils fournissent des données cohérentes et exploitables qui vous permettent de suivre le succès de l’optimisation sur site grâce à la progression du volume de visibilité.

Pour une vision globale

Le lab data et le field data ne sont pas des approches concurrentes, elles sont complémentaires. Le prompt tracking vous aide à comprendre votre environnement concurrentiel et le positionnement de votre marque, tandis que l’analyse de logs, via Oncrawl, vous montre comment améliorer les performances techniques et obtenir des résultats mesurables. Ensemble, elles vous offrent une vue d’ensemble de votre parcours d’optimisation de la recherche IA.

Cependant, il est important de noter que l’analyse des bots IA ne sert pas uniquement à mesurer le succès de la visibilité IA, elle permet également de trouver des informations exploitables.

Dans le prochain article, j’aborderai les étapes à suivre pour combiner les données des logs et du crawl avec celles de Google Search Console.

Share :
Jérôme Salomon
Product Lead @ Oncrawl
Sujets en lien :

Découvrez ce qu'Oncrawl peut faire pour vous

Demander une démo