Things-not-strings-Semantic-and-entity-SEO-250px

SEO sémantique et des entités

4 juin 2024 - 6  min de lecture - par Nicolas Piquero
Accueil > SEO Technique > SEO sémantique et des entités

Ne pensez plus aux mots-clés. Pensez plutôt aux thèmes. C’est ce que les moteurs de recherche visent à comprendre.

Nous allons approfondir cette idée, mais avant cela, pour bien comprendre ce concept, commençons par voir comment le PageRank fonctionne actuellement.

L’évolution du PageRank

Le PageRank initial a évolué au fil des ans pour devenir un PageRank sensible aux thèmes, introduit en 2012 par un ingénieur logiciel de l’époque, Taher Haveliwala.

En quelques mots, le PageRank qui est sensible aux thèmes donne plus de valeur aux liens établis entre des pages sémantiquement alignées.

C’est ainsi que fonctionne le PageRank proprement dit et nous pouvons constater qu’il fait intervenir deux facteurs : les thèmes et la valeur sémantique.

L’évolution d’une simple chaîne de mots vers des concepts

En gardant cela à l’esprit, en passant d’une analyse basée sur les mots-clés à une analyse basée sur les thèmes, nous sommes en mesure d’avoir une vue d’ensemble et de couvrir éventuellement un concept de manière holistique.

Par exemple, en analysant le corpus sémantique du thème du yoga, nous trouvons des termes tels que « santé mentale », « syndrome du canal carpien » et « hypertension artérielle » (voir ci-dessous).

Yoga - semantic corpus

Source : YourText.Guru

 

S’agit-il de termes que l’on trouverait en recherchant des mots-clés liés au yoga ? Je n’en suis pas sûr…

S’agit-il de termes qui ont une relation sémantique avec le thème du yoga ? Oui, ils le sont.

Par conséquent, créer des pages basées sur des termes provenant d’une analyse de sujet plutôt que d’une analyse de mots-clés vous permet de créer des pages qui sont sémantiquement alignées. Il est important de garder cela à l’esprit lors de l’élaboration d’une stratégie de contenu.

Mais cela ne suffit pas…

Le SEO de l’entité

Nous avons vu que les moteurs de recherche ont évolué au fil des ans ; ils sont désormais capables de comprendre le contexte, le sens et l’intention derrière une requête, afin de servir des résultats pertinents aux utilisateurs, et donc de positionner les pages en conséquence.

Avec l’introduction de l’IA dans les moteurs de recherche, comme le Google AI Overviews, il devient encore plus important de leur fournir des pages pertinentes et structurées, afin qu’ils comprennent en profondeur la signification du contenu, et qu’ils accordent finalement plus d’autorité et plus de visibilité sur les SERPs.

C’est là que les entités entrent en jeu !

Une entité désigne une chose ou une idée singulière, unique, bien définie et distincte. Une entité peut être une personne, un objet, une organisation, un lieu, un concept, etc.

Nelson Mandela est une entité, Londres est une entité, une pomme est une entité, la philosophie est une entité, le yoga est une entité.

Une approche sémantique

Revenons donc à notre exemple du yoga. En analysant son corpus sémantique afin de produire des pages sémantiquement alignées, nous trouverons probablement le terme « Hatha yoga » (une pratique de yoga à part entière). Ce terme peut facilement devenir une page que vous pourriez créer sur le thème du yoga. D’autre part, « Hatha yoga » est également une entité, comme vous pouvez le voir ci-dessous.

Hatha yoga knowledge graph

Il serait donc plus efficace de se concentrer sur cette entité spécifique de notre page et de la baliser afin d’améliorer la compréhension sémantique et l’interconnexion du contenu, et de fournir une référence claire et non ambiguë au concept.

Nous pouvons utiliser la propriété sameAs pour fournir cette référence claire et non ambiguë à l’entité et pour indiquer que le sujet de notre page est équivalent ou étroitement lié à la page Hatha yoga de Wikipedia, à l’article Hatha yoga de Wikidata et au Knowledge Graph de Google sur le Hatha yoga. Voir ci-dessous :

sameAs schema markup

L’établissement de liens avec des bases de connaissances telles que la page Wikipédia et le Knowledge Graph de Google pour une vue d’ensemble compréhensible, et l’élément Wikidata pour les données structurées, renforce la profondeur sémantique du contenu, facilite la désambiguïsation et fournit une connexion de données plus riche pour les moteurs de recherche.

Grâce à la propriété sameAs, nous pouvons également établir un lien avec d’autres sources faisant autorité, comme par exemple :

  • Ressources pédagogiques
  • Site officiel
  • Articles de presse
  • Livres
  • Publications
  • Profils de réseaux sociaux

En outre, nous pouvons utiliser des balises de schéma supplémentaires pour établir un lien avec le concept, comme par exemple :

  • Article ou BlogPosting : si le contenu est destiné à être une page de blog.
  • ExercisePlan : si le contenu concerne un plan d’exercice spécifique ou une routine qui inclut le Hatha yoga.
  • HealthAndBeautyBusiness ou SportsActivityLocation : si vous voulez signaler une entreprise ou un lieu qui propose des cours de Hatha Yoga.
  • Event : si vous organisez des cours de Hatha Yoga, des ateliers ou des retraites.
  • Person : pour mettre en évidence les instructeurs ou les fondateurs associés au Hatha Yoga.
  • Organization : pour les pages représentant des entreprises ou des organisations, comme des studios ou des centres de yoga.
  • CreativeWork : pour des contenus tels que des articles, des livres ou des vidéos d’instruction sur le Hatha yoga.

Le triple sémantique

La mise en œuvre d’une stratégie de balisage par schéma et la connexion d’entités dans une stratégie de contenu, ou sur l’ensemble d’un site web, vous permettent de créer un graphe interconnecté sur un schéma connu sous le nom de triple RDF (déclarations « Sujet – Prédicat – Objet ») qui aide les moteurs de recherche à comprendre les relations entre les entités.

Pour illustrer le schéma RDF Triple tout en restant dans le domaine du yoga, nous pourrions créer une page sur Mark Singleton, un professeur de yoga spécialisé dans le Hatha yoga. L’entité Mark Singleton apparaît lors de l’analyse du corpus sémantique Hatha yoga ; une fois encore, nous ne mentionnons pas ici l’analyse basée sur les mots-clés.

  • Mark Singleton serait le sujet
  • knowAbout (propriété) serait le prédicat
  • Hatha yoga serait l’objet

Mark Singleton et Hatha yoga sont deux entités et sont liées l’une à l’autre.

D’autre part, si nous décidions de créer une page sur le thème du Hatha Yoga, la faire pointer vers cette page depuis la page de Mark Singleton grâce à la propriété sameAs ne serait pas une mauvaise idée. Voici un exemple de la façon de faire :

knowsAbout schema markup

BONUS : les thèmes des deux pages proviennent du même corpus sémantique, ce qui les rend sémantiquement proches l’un de l’autre ou, en d’autres termes, sémantiquement alignés. Le fait de les relier l’une à l’autre par un maillage interne serait bénéfique pour le PageRank, qui est sensible aux thèmes.

C’est maintenant à vous de jouer

C’est un exemple rapide de la façon de combiner la sémantique et les entités dans le SEO, mais je suppose que vous avez compris : c’est la façon dont vous passez d’une approche lexicale + contenu non structuré à une approche sémantique + contenu structuré.

En faisant cela, vous définissez un graphe de connaissances interne qui fournit une structure et un contexte aux moteurs de recherche, maximisant ainsi vos chances d’être considéré comme une ressource digne de confiance pour le sujet pour lequel vous visez à obtenir de la visibilité.

Nicolas Piquero Voir tous ses articles
Nicolas est consultant en SEO et formateur en entreprise. Il est spécialisé dans la sémantique et les stratégies thématiques. L'analyse des sujets, les relations sémantiques, les ontologies, l'interconnexion des entités, les triples RDF, la construction d'un graphe de connaissances interne, le balisage de données structurées, l'optimisation du flux de PageRank interne et la création d'un maillage thématique sont des termes et des techniques qui façonnent son travail quotidien. Il collabore avec des marques et des entreprises de divers secteurs sur le marché international, les aidant à améliorer leur visibilité organique grâce à des stratégies sémantiques sur mesure. Il est l'ambassadeur britannique des outils sémantiques Babbar.tech et Yourtext.guru.
Sujets en lien :