Le NLP dans le SEO

30 juin 2020 - 31  min de lecture - par Milosz Krasinski
Accueil > SEO Technique > Le NLP dans le SEO

Le NLP (Natural Language Processing), commence-t-il vraiment à jouer un rôle dans le référencement, ou s’agit-il simplement d’un terme de geek utilisé par les organismes de SEO technique ?

Lorsque les gens réaliseront que NLP est l’abréviation de « Natural Language Processing » et non pas un hypno-mumbo-jumbo des années 1970, ils réaliseront que non seulement il est là pour rester, mais que c’est le fondement même du mantra « organiser l’information du monde ». L’information ne concerne pas seulement les sites web, c’est pourquoi Google a besoin de son propre référentiel pour stocker les idées, les sujets et les « choses ». Le NLP (et les NLU et BERTs et BERTIEs et Word2Vec, CBOW et même les nGrams et d’innombrables autres approches mathématiques) sont des tentatives pour transformer les idées humaines en structure compréhensible par les machines. Google a acheté Freebase pour une somme colossale et il semble maintenant que la société soit dirigée par des prophètes de la compréhension de l’activité humaine ! »

Dixon Jones, CEO Inlinks.net

De temps en temps, un changement dans un algorithme se produit, et si vous avez la chance d’être l’un des premiers à le voir et à adapter votre référencement, vous en tirez des bénéfices considérables pendant que tous les autres voudront rattraper le retard.

Ainsi, les SEOs avertis vérifient toujours en cours de route pour voir d’où viendra le prochain changement significatif.

Dans ce cas, le NLP est-il l’un de ces changements ? On dirait bien que oui.

Notre récente étude de cas, dans laquelle nous avons établi un partenariat avec différents SEOs très respectés dans le secteur, a montré des résultats significatifs lorsque l’optimisation du NLP a été mise en œuvre.

Commençons par le début. Laissez-moi vous guider à travers :

  • Ce qu’est le NLP
  • Comment il est connecté à l’algorithme de Google
  • Pourquoi c’est important
  • Les moyens pratiques de mettre en œuvre le NLP dans votre SEO

Fin 2019, Google a annoncé la sortie officielle de l’algorithme BERT. Le fait même qu’ils l’annoncent signifie qu’il s’agit d’un élément important, ce que Google a confirmé en déclarant que le déploiement complet touchait 10 % de toutes les requêtes de recherche.

La communauté du SEO a fait ce qu’elle fait toujours après une mise à jour. Ils ont collecté des données pour effectuer des tests, ont rassemblé leurs idées et ont décidé que BERT se concentrait sur la qualité du contenu, du contexte et du traitement du langage naturel (NLP).

Pourquoi BERT et le NLP vont de paire

En essayant de comprendre le « contexte » des requêtes de recherche et en exploitant la relation entre les mots-clés et les autres mots de la requête, l’algorithme BERT de Google repousse les limites de la compréhension des besoins de l’utilisateur par un moteur de recherche traditionnel. Google s’appuyant sur le NLP pour mieux comprendre les requêtes des utilisateurs, cela implique que les créateurs de contenu qui obtiennent des informations plus spécifiques, plus pertinentes et plus descriptives avec leur contenu et leurs informations (y compris les liens) dans leurs pages ont tendance à être mieux classés.

Jaya Kumar – Data Scientist, Deep Learning et spécialiste NLP

La meilleure façon de comprendre le NLP dans une perspective SEO est de d’abord comprendre BERT.

BERT signifie « Bidirectional Encoder Representations from Transformers » (Représentations de codeurs bidirectionnels à partir de transformateurs).

BERT contient deux composantes principales : les données (modèles préformés) et la méthodologie (manière définie d’apprendre et d’utiliser ces modèles).

Lorsque nous parlons de modèles, nous entendons des ensembles de données. BERT collecte donc des ensembles spécifiques de données relatives au contenu et apprend ensuite à comment analyser ces données.

Le NLP est le cerveau de BERT. Il est capable de comprendre le mot ou la phrase dans son contexte en examinant les différents signaux qui l’entourent, les mots qui le précèdent jusqu’à ceux qui l’entourent, de la sous-section de la page à la page entière.

Si vous pouvez analyser le contenu des pages bien classées par Google et examiner le contenu avant/après les phrases et les mots, puis optimiser votre page pour offrir quelque chose de similaire, vous pourriez fournir à Google quelque chose de très semblable aux pages les mieux classées. C’est ce que représente le NLP !

Google ne regarde plus les mots ou les phrases individuellement comme nous l’avions compris dans le passé lorsqu’il effectuait traditionnellement des recherches par mots-clés. Mais maintenant, il s’intéresse aux phrases, aux paragraphes et à la requête dans son ensemble. Ils examinent le “sentiment”.

Il est important de se rappeler que le NLP existe depuis des décennies. Ce n’est pas une « nouvelle technologie » que Google a soudainement adoptée. Ils l’ont toujours utilisée, sous une forme ou une autre. Maintenant, c’est BERT, mais cela peut changer au fur et à mesure des développements dans ce domaine.

Le NLP est très utile pour comparer les sujets que vous avez couverts dans votre contenu ou celui de votre concurrent. Je l’utilise principalement pour voir si j’ai pu manquer quelque chose, ou si je dois ajouter du contenu complémentaire autour du contenu principal.

En fin de compte, ne vous attachez pas aux outils. Lorsque votre contenu est terminé, prenez un peu de recul et évaluez si votre contenu a du sens. Les moteurs de recherche ne vous achèteront jamais rien, ce sont les utilisateurs qui le feront. Donnez aux utilisateurs ce qu’ils veulent !

Steven van Vessum, VP chez ContentKing

Le NLP vu par Google

Lorsque nous essayons de prévoir et d’évoluer avec Google, nous devons toujours considérer l’évolution de l’algorithme du point de vue de Google. Que cherchent-ils à tirer de la mise à jour et de l’introduction du NLP ?

La réponse est la qualité de la recherche.

Pour Google, c’est l’expérience de l’utilisateur qui permet de garder les lumières allumées.

Les utilisateurs ont possédé toute une génération d’internet. Ils sont plus intelligents dans leurs recherches et sont plus précis sur ce qu’ils veulent voir. Ils sont également plus impatients et Google doit continuer à s’adapter ou à s’améliorer, sinon un autre moteur de recherche le fera et le monopole de Google sur le monde s’arrêtera.

Selon les informations que nous pouvons trouver sur le blog de Google, 15% des requêtes de recherche sont utilisées pour la première fois. Les gens utilisent de plus en plus les recherches à longue traîne pour trouver une réponse à leur question, surtout avec l’essor de la recherche vocale.

Cela signifie que, parfois, l’algorithme ne dispose pas d’assez de données historiques pour anticiper l’intention derrière le terme de recherche, il va donc avoir du mal à comprendre ce que l’utilisateur recherche.

L’essentiel est de mieux comprendre la langue. Le NLP est le moyen qu’utilise Google pour y parvenir.

Permettez-moi de citer l’article de Pandu Nayak :

Avec les dernières avancées de notre équipe de recherche dans la science de la compréhension des langues, rendues possibles par l’apprentissage automatique, nous améliorons considérablement la façon dont nous comprenons les requêtes, ce qui représente le plus grand bond en avant de ces cinq dernières années et l’un des plus importants dans l’histoire de la recherche.

Le contenu est plus que le roi, c’est le royaume

Google BERT est l’un des plus importants et des plus énormes bonds en matière de développement global de la recherche Google au cours des dernières années. La véritable puissance de Google BERT vient du Transformer, un mécanisme d’attention qui reconnaît la relation contextuelle entre les mots d’un texte. ELMo et ULMFiT sont les deux autres composantes de BERT, la première résout le problème de la polysémie en NLP et la seconde améliore considérablement le processus d’apprentissage du transfert.

Avec BERT, nous avons l’attention au mot suivant et au mot précédent, l’attention entre les mots clés identiques/liés, les mots identiques/liés dans d’autres phrases, l’attention aux autres mots prédictifs du mot, l’attention aux jetons de délimitation. Cela rend l’apprentissage et l’examen des mots contenus dans une requête beaucoup plus sophistiqués et précis qu’auparavant.

Dido Grigorov, Head of SEO chez Serpact

De nombreuses phrases contiennent des « mots d’arrêt » ou des mots qui ont des significations multiples, comme « to », « in », « get-go », etc. Ces mots ont tellement de sens qu’il est difficile pour Google de comprendre le contexte, même si le machine learning progresse aussi rapidement qu’il le fait.

C’est là que le sentiment entre en jeu. Un autre outil que Google a développé pour comprendre le contenu.

Par sentiment, nous entendons la nuance ou le sentiment représenté dans le contenu. Il peut être positif, négatif ou neutre, et il est évolutif.

En termes simples, le sentiment positif signifie l’utilisation de mots positifs, comme excellent, abordable et soulager. Tout ce qui, dans un tel contexte, a une signification ou un résultat positif. Par exemple :

Le médicament est génial, il fonctionne vraiment, il soulage la douleur, et il est aussi abordable.

On leur attribue une note de sentiment entre 0,25 et 1, alors qu’à l’inverse, on leur attribue une note de sentiment négatif entre -0,25 et -1,0.

Cela nous laisse avec un sentiment neutre, c’est-à-dire lorsque le score du sentiment se situe entre ces deux chiffres. Donc entre -0,25 et +0,25.

Nous savons également que Google examine les sentiments à la fois au niveau des pages et des sous-sections.

Pourquoi le sentiment est-il important pour les SEOs ?

Simplement, si tous les résultats de la page 1 offrent un sentiment positif et que votre page est principalement classée comme ayant un sentiment négatif, il y a de fortes chances que Google ne considère pas votre page comme pertinente par rapport à ce que l’utilisateur recherche.

Vous devez savoir ce qu’est une « entité »…

Si vous voulez approfondir le NLP et commencer à travailler avec lui (ce que nous vous suggérons de faire), vous tomberez sur le terme « entité », qui est essentiel pour comprendre le NLP et son fonctionnement.

L’entité est un mot ou une phrase qui représente un objet qui peut être identifié, classé et catégorisé.

Voici quelques exemples d’objets :

  • les personnes
  • les biens de consommation
  • événements
  • numéros
  • organisations

Le travail du NLP consiste à sélectionner et à évaluer ces entités à partir de votre contenu.

Comme Google distingue ces entités, le moteur de recherche est capable d’utiliser ces informations pour satisfaire l’utilisateur et fournir de meilleurs résultats de recherche.

Avec le NLP, deux mesures supplémentaires sont essentielles : la saillance et la catégorie.

Catégorie : il n’y a pas grand-chose à expliquer. En tant que SEO, nous sommes habitués à ce que les catégories soient importantes.

Saillance : en NLP, elle représente l’importance de l’entité dans le texte.

Par exemple, le mot « matin » peut être plus important que « soir » quand on parle de petit déjeuner. Dans ce contexte, Google accorderait donc plus d’importance au mot « matin » qu’au mot « soir ».

L’entité se voit attribuer un score de saillance allant de 0,0 à 1,0. Plus la valeur de saillance est élevée, plus l’entité est importante et pertinente pour le sujet de la page.

Google place les mots dans leur contexte et classe les entités par ordre d’importance par rapport au contexte de la page.

Comprendre le NLP : tout mettre en place

Nous avons couvert les fondements du NLP et, en particulier, ses relations avec BERT. Récapitulons rapidement avant de parler de la manière dont nous pouvons intégrer le NLP dans certaines de nos stratégies et processus d’optimisation des moteurs de recherche.

Le NLP est essentiellement le processus que Google a incorporé pour mieux comprendre les principaux mots ou expressions clés d’une page en examinant le contenu qui les entoure.

Il peut s’agir d’un mot qui précède et suit directement l’entité » analysée, le contexte de la sous-section ou la page entière. On peut alors l’examiner sous l’angle des sentiments. Quel genre d’émotions un contenu suscite-t-il, par rapport à d’autres qui sont classés ?

Enfin, il y a une catégorie et une saillance. Comment pouvez-vous classer ce contenu ? Nous classons les entités par rapport au contenu environnant pour en déterminer l’importance. Certains mots sont plus importants que d’autres dans un contexte spécifique

C’est la théorie du NLP par rapport à Google et au SEO qui va de l’avant. Mais qu’est-ce que cela signifie en pratique ?

Comment intégrer le NLP dans votre stratégie de référencement (surtout après la mise à jour de BERT)

Le NLP, traitement du langage naturel, est un terme qui est souvent utilisé pour désigner des « entités ». Les entités sont des « choses » telles qu’une personne, un lieu ou un objet. J’ai vu des entités efficaces dans ce domaine. Cette année, les entités se sont régulièrement classées parmi les 15 premiers facteurs dans le classement des 100 premiers facteurs de l’IMG. La partie la plus délicate a été d’isoler les entités dans un environnement de test. Je n’ai pas eu beaucoup de chance dans ce domaine. Il faut cependant noter que les entités sont généralement des noms. Lorsque vous regardez des listes de termes contextuels, comme les listes des LSI ou les listes générées par des outils qui utilisent TF-IDF, vous remarquerez qu’il y a beaucoup de chevauchements entre les listes. Avec ce chevauchement, il sera difficile pour les gens de continuer à dire que Google n’utilise pas les LSI s’ils prétendent également que Google utilise des entités.

Kyle Roof, co-fondateur, Internet Marketing Gold

Il existe une expression courante en anglais britannique. « Il y a plus d’une façon d’écorcher un chat. »
Je ne sais pas pourquoi les Anglais courent partout en écorchant les chats, mais le sentiment est parfait pour cette section.

Il y a une variété de stratégies qui sont efficaces en matière de référencement. Il est donc très difficile de donner des conseils sur la mise en œuvre du NLP dans votre référencement sans avoir l’air de croire que vous savez tout.

Ce n’est pas mon avis. Mais il serait bon d’utiliser des exemples pratiques de la façon dont certains membres de la communauté SEO ont adopté le NLP et comment vous pouvez l’adapter à vos propres théories et stratégies de référencement comme vous le souhaitez.

Démonstration de l’API en langage naturel de Google

Je ne serais pas surpris d’apprendre que Sergey et Larry parlaient déjà d’une sorte de capacité NLP lorsque BackRub a été conçu. Bien sûr, à l’origine, il était prévu que ce soit juste un moyen de quantifier et de qualifier les liens vers une URL donnée. Mais une fois qu’ils ont surmonté leur résistance initiale à l’idée d’un moteur de recherche soutenu par la publicité, je serais prêt à parier qu’ils ont reconnu combien le défi – sans parler de l’opportunité – était plus grand que prévu pour faire correspondre une requête au contenu d’une page. Le traitement du langage naturel existait déjà et si quelqu’un a plus contribué à son développement que Google, il a su faire profil bas.
Le NLP peut être appliquée à l’analyse des requêtes et à l’analyse du contenu, mais c’est dans le premier cas qu’elle est vraiment rentable. Déterminer les intentions et les besoins d’un chercheur est, après tout, le facteur le plus important pour toute entreprise qui prétend chercher à fournir les meilleurs résultats possibles pour chaque recherche. L’astuce consiste à faire cela en quelques millisecondes et à l’échelle, et le NLP semble être au cœur de nombreuses mises à jour récentes de Google. Le NLP et les vecteurs de mots vont de pair, et il est évident que le moteur de recherche a beaucoup amélioré sa compréhension des requêtes et du contenu des pages au cours des dernières années. Et vous ?

Doc Sheldon, Fondateur Intrinsic Value SEO

Un SEO réussi commence presque toujours par des données. Dans ce cas, nous avons la chance que Google dispose d’une démo d’API en langage naturel que vous pouvez brancher et examiner gratuitement n’importe quel texte, ce qui vous donne beaucoup de données nécessaires pour travailler avec le NLP.

Vous pouvez voir visiblement comment Google a analysé le texte de votre page et le comparer aux pages qui dominent le SERP.

[Ebook] Technical SEO for non-technical thinkers

Le SEO technique est l’un des domaines SEO actuellement en pleine croissance. Il s’agit de trouver des solutions SEO sur la base du pourquoi et comment fonctionnent les moteurs de recherche et les sites web. Dans cet ebook, découvrez tout ce que vous avez toujours voulu partager avec vos clients, vos amis, et vos collègues au marketing.

La recherche par mot-clé va plus loin

La mise à jour de BERT nous a donné une situation « avant et après » que nous pouvons utiliser pour faire des comparaisons. L’examen des mots clés qui ont pris un coup après la mise à jour de BERT, et ceux qui sont restés forts ou se sont améliorés peut vous aider à mieux comprendre ce que Google recherche.

Si votre page d’évaluation des affiliés a été sélectionnée, il se peut que les résultats de la nouvelle page 1 pour cette recherche sont principalement constitués de magasins e-commerce ou de grands sites comme eBay ou Amazon.

Dans cet exemple, Google semble examiner cette requête et décider que les internautes cherchent des prix et à acheter le produit. C’est pourquoi votre page d’avis a été touchée ; elle offre une intention différente.

Regardez pour quels autres mots clés ces pages de tête sont également classées. Ne vous contentez pas de regarder le trafic et de réfléchir à ce que vous voulez classer, regardez les combinaisons de mots clés que Google juge appropriées pour ce type de requête spécifique.

Les pages les mieux classées le sont également pour les mots clés X, Y et Z. Si Google aime cette combinaison de mots-clés, vous pouvez également cibler votre propre contenu sur cette combinaison de mots-clés.

Liens internes et externes

Les liens prennent une nouvelle dimension. Ce n’est pas seulement une question d’autorité et de pertinence ; (ce qui est le cas, nous ne dévalorisons pas ces paramètres) mais aussi de contexte de la page.

Grâce au NLP, la structure et le placement des liens sont encore plus importants. Qu’est-ce que le texte d’ancrage ? Est-il contextuellement pertinent pour la page ? Et, surtout, où est-il placé sur la page ?

Nous ne pouvons pas placer un lien au hasard sur la page ; il doit avoir un sens par rapport au contenu. Le lien doit avoir le bon contexte pour avoir toute sa valeur.

Rick Lomas de Link Detective a dit,

Google a répété à maintes reprises qu’un lien devait exister pour améliorer l’expérience du lecteur. Cela va être plus important que jamais.

Il ne sert à rien de « réinventer la roue ». S’il existe des informations adéquates sur quelque chose ailleurs sur Internet, il est tout à fait logique d’établir un lien vers cette information.

Un exemple de lien externe pour Google (IMHO) serait dans une phrase du genre :

« Si vous vous demandez comment utiliser l’espace dont vous disposez dans votre cuisine, Bella Cuisine a d’excellents designs de cuisine. »

Il s’agirait d’un lien légitime que les gens pourraient suivre pour en savoir plus sur les designs de cuisine, ce qui améliorerait l’expérience du lecteur.

D’autre part… Des liens dans des phrases comme :

« J’ai décidé de faire ce sandwich en utilisant le meilleur couteau de cuisine en acier inoxydable que je pouvais trouver »

Cela n’améliorerait pas l’expérience de quelqu’un qui cherche des idées de sandwichs car le lien se concentre sur le couteau qu’il pourrait utiliser pour le faire.

Les liens internes sont totalement sous votre contrôle, mais les mêmes règles s’appliquent – essayez d’utiliser les liens internes pour améliorer l’expérience du lecteur afin qu’il puisse atteindre son intention de recherche initiale.

Analyse des concurrents

Partons de la théorie selon laquelle si les pages de tête (d’intention similaire) sont aussi bien classées, c’est sûrement parce que Google les aime. Elles correspondent bien.

En partant du principe que, toutes choses étant égales, la pertinence, l’autorité, l’âge du site, etc. sont similaires, si le contenu de votre page est similaire en termes de mesures importantes pour Google, vous devriez vous attendre à être classé de la même manière.

Ce n’est jamais aussi précis, il y a toujours des exceptions, mais c’est un excellent point de départ.

L’analyse de contenus comme le tf-idf est une étape, et une étape importante ! Optimiser de cette façon vous permettra d’obtenir des résultats.

Nous savons que Google intègre d’autres ensembles de données, comme le sentiment, les entités, la catégorie et le score de “saillance”. Il les interprète ensuite dans le cadre de son algorithme de classement ; il est donc logique d’analyser les concurrents en fonction de ces paramètres et de déterminer les points sur lesquels votre page se distingue de ces mêmes pages. Grâce à ces informations, vous pouvez apporter des modifications.

Le rôle de la recherche est de mettre en relation les gens avec les réponses.

Pour ce faire, les services intelligents basés sur l’IA, comme les moteurs de recherche et les assistants vocaux, doivent comprendre le monde qui nous entoure, dans les mêmes termes que nous, et ils le font en parcourant toutes les informations qui existent sur le web. Ils apprennent mieux lorsque ces informations sont structurées pour la recherche avec un schéma de balisage spécial qui fournit le contexte et la signification, mais la plupart des contenus disponibles actuellement n’existent pas dans ce format. Il est donc difficile pour les moteurs de recherche de discerner entre les faits objectifs et subjectifs, et il est facile de renvoyer des réponses erronées.

Si les mêmes systèmes étaient capables de comprendre un sujet de manière approfondie et objective, ils pourraient être plus fiables pour distinguer les bonnes réponses des mauvaises. Les progrès dans la compréhension du langage naturel peuvent nous aider à débloquer cet avenir.

Ric Rodriguez, Consultant SEO – Yext

Points clés à retenir

Comprendre le NLP vous permet de comprendre comment Google regarde votre page. Les facteurs de classement plus traditionnels conservent leur importance, mais en plus, Google pousse massivement vers la compréhension des intentions des utilisateurs et de la pertinence des recherches. Nous devrions nous en réjouir !

Maintenant que nous connaissons les nouveaux paramètres de Google, nous pouvons analyser nos propres pages, analyser les pages qui obtiennent de bons résultats et voir où il y a des différences significatives. Nous pouvons apporter des changements et voir comment Google réagit.

Chez Surfer, nous avons créé un outil qui automatise une grande partie de cette analyse pour vous. Tant dans la collecte des données que dans leur interprétation. En d’autres termes, ce que vous devez faire à votre page pour lui donner la saveur ou le sentiment des pages les plus appréciées dans la recherche.

Cela ne veut pas dire que le NLP est le seul facteur qui compte. Mais nos données et celles collectées par d’autres membres de la communauté SEO nous ont montré que cela fait bouger les choses, ce qui est passionnant.

Comme pour la plupart des choses du domaine SEO, ceux qui réagissent en premier et s’adaptent aux changements en récoltent tous les fruits. En gardant cela à l’esprit, le NLP doit valoir la peine d’être explorée car peut-être que vos concurrents ne le sont pas encore, et cela vous donne un avantage.

Un grand merci à Michał Suski de Surfer SEO pour avoir fourni de superbes données et avoir été un mentor sur le sujet du NLP.

Citations bonus des experts du secteur…

L’algorithme BERT de Google cherche en fin de compte plus de contexte sur la page. Il est important de tenir compte des principales couches de mots clés incluses dans les résultats de la première page et d’adapter votre contenu en conséquence. J’ai eu de belles réussites en analysant le contenu de la première page pour les mots-clés primaires et secondaires et leurs mots-clés parents afin de créer un meilleur contenu. Par exemple, un utilisateur peut rechercher les « meilleurs vignobles d’Australie ». Lorsque vous analysez les résultats de la première page pour le mot-clé le plus mentionné et leurs croisements avec leurs concurrents, vous remarquerez un schéma. C’est cette tendance que Google remarque que ses utilisateurs recherchent. Par exemple, je pourrais obtenir une ventilation des meilleurs vignobles australiens et ce qui les rend les meilleurs pour arriver en première page. Un autre résultat pourrait être des mentions de grands domaines viticoles en Australie, mais ils ont également inclus les principaux cépages pour lesquels l’Australie est connue en premier lieu. Si je devais produire un article plus solide, j’analyserais les croisements de mots-clés primaires et secondaires et je dresserais un tableau de la façon dont les utilisateurs ont besoin que leur réponse soit écrite et structurée. Dans ce cas, j’inclurais une couche des régions et des cépages pour lesquels l’Australie est connue, puis je parlerais du meilleur vin que l’Australie a à offrir. Vous voyez comment j’ai pris le meilleur des 2 résultats et l’ai incorporé dans le mien ? Maintenant, Google a un article solide pour choisir les meilleurs résultats.

Jacob Stanley 

Alors que Google progresse en tant que première entreprise d’IA, on ne peut pas surestimer l’importance de comprendre comment optimiser le contenu pour le NLP. Avec la recherche vocale qui fait progresser les recherches sémantiques d’un sac de mots-clés à des questions à longue traîne, il ne fait aucun doute que la création de contenu pour le langage humain et la compréhension de la machine simultanément est là pour rester.

Clarence Lam  Consultant NLP & AI

La mise à jour de l’algorithme BERT de Google se concentre sur l’amélioration de la compréhension des langues. Cela signifie que Google essaie de mieux comprendre les requêtes en langage naturel/conversation et de mieux comprendre la nuance et le contexte des mots dans les recherches afin de pouvoir mieux faire correspondre ces requêtes avec des résultats utiles. Cela signifie qu’avec l’utilisation du traitement du langage naturel (NLP) pour comprendre le contexte des recherches, il devient de plus en plus important de fournir un contenu informationnel de haute qualité pour être mieux classé dans les SERP. Les SERP se concentreront davantage sur la création d’un contenu de haute qualité répondant à des questions très spécifiques. Il s’agira également de se concentrer sur les mots clés à longue traîne qui seraient également utiles pour obtenir un meilleur classement dans les recherches vocales, car les gens utilisent des phrases plus longues (plus de mots clés à longue traîne) lorsqu’ils utilisent la recherche vocale par rapport à la saisie d’une requête dans Google.

Eva Lauridsen, Head of Partnerships, AccuRanker

Il est clair que les SEOs ont manifesté un intérêt accru pour tout ce domaine avant même la mise à jour BERT.

Je pense que la nature bidirectionnelle de cet algorithme est intéressante car elle montre les efforts supplémentaires que Google s’efforce de faire dans sa quête pour comprendre correctement l’intention des utilisateurs et soyons honnêtes – ils ne font que commencer. Où en serons-nous dans 10 ans !

Mais se demander si le NLP est un bon outil pour le SEO, c’est comme se demander si un marteau est un outil utile pour rénover sa maison. Il pourrait certainement être utile, mais cela dépendra bien sûr de la tâche à accomplir.

Si vous avez vraiment besoin d’analyser un corps de texte raisonnable et de comprendre le contexte et la signification de l’article, alors il sera utile – par exemple, vous pouvez utiliser l’API de langage naturel de Google (ou IBM Watson ou d’autres alternatives de source ouverte comme OpenAI) pour analyser et/ou catégoriser les pages web qui pourraient vous être utiles si vous regardez les concurrents des SERP au niveau du marché ou des mots clés pour vous dire avec quels types de sites/pages vous êtes en concurrence.

Si vous cherchez à regrouper des groupes de mots clés et de pages de classement pertinents pour découvrir les meilleures possibilités d’optimisation et les mettre en correspondance avec le parcours de l’acheteur, vous pouvez utiliser un certain nombre d’approches et d’outils différents. Par exemple, un outil tel qu’un algorithme de détection de communauté pourrait vous aider à trouver plusieurs ensembles de mots clés étroitement liés (qui ne sont pas nécessairement liés sémantiquement) à l’échelle, et vous pourriez utiliser un autre outil tel que TF/IDF pour étiqueter chaque groupe. Vous pourriez ensuite utiliser un troisième outil (comme notre API d’intention de SERP) pour comprendre l’intention écrasante de l’utilisateur pour cet ensemble de mots clés en analysant chaque SERP.

Je vous conseille donc d’être attentif. Nous pouvons clairement voir pourquoi Google l’utilise. Cela signifie-t-il que vous devez combattre le feu par le feu et aussi investir du temps et de l’argent dans la compréhension des dernières techniques NLP ou de machine learning ? Peut-être que ce serait amusant, mais ce n’est probablement pas nécessaire….Je veux dire qu’après tout, il y a beaucoup de plateformes de logiciels de référencement qui aiment faire ça toute la journée 😉

Bryan Bloom, Fondateur, Mover Search Marketing

Le NLP dans le SEO est absolument vitale aujourd’hui et le deviendra encore plus car cela aide Google à comprendre et ensuite à déterminer la pertinence (d’un bloc de contenu, de la page, du site web). En devenant plus compétent, le NLP vous permet d’avoir une vision plus globale de l’ensemble des changements SEO. Vous commencez à comprendre, à visualiser, puis vous pouvez imiter les schémas que Google voit et préfère pour n’importe quel terme de recherche. Google essaie simplement de reproduire les intentions et les usages du quotidien dans le domaine de la recherche.

Te souviens-tu quand ta mère disait ton nom et qu’elle était aussi en colère, par opposition au fait de dire ton nom alors qu’elle est si fière de toi ? Le mien serait « Bryan Bloom ! » (mêmes 2 mots) mais je connaissais la tonalité, même sans autres mots. Google comprend la tonalité (fou contre heureux, etc.) et le sens avec le NLP, les mots avant, après, comment ils sont liés, connectés, les entités, etc. De plus, Google recherche des liens pour classer la pertinence. Par exemple, si un article est écrit sur les courses de chevaux et qu’il contient les mots jockey, ligne d’arrivée, paris, piste de course, et que l’autre article ne contient pas… lequel, selon vous, sera le mieux classé ?

Laurence O’Toole, CEO, Authoritas & Linkdex

Depuis très longtemps, les spécialistes de l’optimisation des moteurs de recherche se cognent la tête contre des murs de briques (virtuels) pour essayer de faire de la rétro-ingénierie sur les moteurs de recherche, alors que dans le même temps, les moteurs de recherche ont dépensé de vastes ressources pour essayer de faire de la rétro-ingénierie sur les humains.
Le NLP, tant du point de vue de la requête que de la page, rapproche d’autant plus les moteurs de recherche de l’imitation humaine évolutive, afin de mieux comprendre le pourquoi et le comment des requêtes de recherche et la meilleure adéquation entre le document et cette requête.
L’évolution d’outils plus intelligents axés sur les entités et le NLP pour aider les moteurs de recherche à comprendre pourquoi une page actuelle peut être classée et comment améliorer une page existante pour la classer est passionnante, principalement parce que les moteurs de recherche sont intrinsèquement humains (et non des bases de données d’entités, de vecteurs et de calculs BERT).
Le plus grand défi que je vois est d’apprendre aux clients et aux collègues qu’il ne s’agit pas d’une simple recherche par mots-clés, de comptage et d’inclusion, mais plutôt d’une méthodologie d’analyse sophistiquée qui intègre un facteur plus « humain » dans le contenu et les connexions de la page afin de fournir les réponses les plus satisfaisantes (tant pour les humains que pour les moteurs) pour chaque requête de l’utilisateur.
Bien que Google ait fait de grands progrès, il existe encore (du moins actuellement) un « art » pour soutenir la science du NLP, avec une touche humaine souvent nécessaire pour trier, sélectionner ou affiner les suggestions apprises en machine.
Comme le dit souvent Kyle Roof… « L’algorithme de Google est un algorithme », mais – je pourrais ajouter – en devenant un peu plus humain à chaque requête.

Grant Simmons, VP of Search Marketing, Homes.com

Le NLP joue un rôle énorme dans la compréhension de ce que veut un utilisateur lorsqu’il tape quelque chose, et c’est l’avantage premier de Google, en fournissant les résultats correspondant à l’intention des utilisateurs. En tant que leader du marché des moteurs de recherche, Google fait tout ce qui peut les rapprocher pour fournir les meilleurs résultats/expériences possibles afin de retenir chaque utilisateur. BERT est le nom de l’adaptation par Google des derniers modèles de recherche qui ne sont pas vraiment faciles à comprendre autrement.

L’apprentissage le plus important pour nous, les SEOs, est de comprendre ce que l’utilisateur veut lorsqu’il se rend sur votre site web, c’est-à-dire l’intention, et de concevoir vos éléments de contenu pour répondre à ces besoins, plutôt que de se concentrer sur certains mots clés spécifiques comme ces beaux jours ».

Nitin Manchanda, Global Head of SEO, Omio.com

Cela en vaut-il la peine ?

Nous avons constaté que les sites web dans des secteurs très compétitifs ou ceux qui ont perdu du trafic peuvent tirer le plus grand profit de l’intégration du NLP dans leur stratégie de référencement. L’utilisation du NLP peut prendre beaucoup de temps, mais elle peut vraiment aider à informer la stratégie de contenu et à réduire le gaspillage de ressources.

Risques et avantages ?

Le plus grand risque lié à l’utilisation du NLP est de ne pas faire de recherches. Nous la trouvons très efficace une fois que nous avons analysé non seulement le site web du client mais aussi les pages des concurrents. Cela nous permet de voir l’impact du NLP dans un secteur avec une certaine certitude, deviner est potentiellement nuisible et sape la raison première d’utiliser le NLP en premier lieu.

Nous utilisons le NLP pour comprendre où nos clients seront considérés comme des experts et l’utiliser pour des stratégies de contenu basées sur des “preuves”. Nous pouvons mieux optimiser le contenu, mais surtout nous pouvons être beaucoup plus agressifs dans le positionnement de l’ensemble du site web au sein d’un secteur.

L’avenir du buzz ?

Lorsque l’industrie du SEO a mis la main sur les outils pour utiliser le NLP, il y a eu beaucoup d’excitation. Mais une grande partie de cet enthousiasme a disparu. Ce n’est pas la solution miracle que beaucoup de spécialistes du SEO recherchaient. Cependant, le NLP fera toujours partie de la recherche et si vous y consacrez du temps, elle peut devenir une partie intégrante de vos campagnes SEO.

Steve Bailey – Head of Technical SEO & CRO – Spike Digital

Le NLP a toujours été un sujet central pour les moteurs de recherche. La caractéristique principale d’un moteur de recherche est de fournir des résultats pertinents aux requêtes entrées.
Cela nécessite plusieurs étapes qui font toutes appel à des techniques NLP à différents niveaux :
– Traitement des requêtes : identifier les erreurs typographiques, comprendre l’intention de recherche, identifier les entités principales
– Traitement des documents : comprendre les structures des documents et les sujets abordés, trouver des entités nommées et comprendre le discours, identifier les sentiments exprimés et repérer les marqueurs du discours humain tels que l’ironie et l’humour.
– Création de pages SERP pertinentes : en sélectionnant les documents correspondant à la requête de l’utilisateur et en ordonnant les résultats en fonction de ce qui pourrait maximiser les attentes de l’utilisateur. Les modèles de notation font partie des techniques NLP avec la TF-IDF en premier lieu et d’autres techniques de notation ajoutées récemment, y compris la personnalisation basée sur l’expérience et la compréhension de l’utilisateur. À ce stade, le machine learning ajoute la personnalisation pour fournir de meilleurs SERP.

Tanguy Moal, CTO, Co-fondateur, OnCrawl

Milosz est un consultant en croissance digitale avec plus de 10 ans d'expériences diverses dans l'environnement digital. Avant d'acquérir Chilli Fruit Web Consulting, il était impliqué dans la stratégie digitale de Plus Guidance, une startup anglaise (désormais acquise) et de Sigma Digital Marketing Agency, une agence basée dans le Oxfordshire (finaliste 2017 des Cherwell Business Awards). Il est également speaker et blogger et consulte pour des marques internationales.
Sujets en lien :