OnCrawl Labs : Génération de texte en SEO

12 novembre 2020 - 4  min de lecture - par Rebecca Berbel
Accueil > SEO Technique > Génération de texte en SEO

L’idée même d’utiliser des machines pour écrire des textes  se résume en un objectif, libérer vos ressources (les êtres humains) dont le temps peut être mieux utilisé pour des tâches plus sensibles ou stratégiques qui nécessitent une touche « humaine ».

Pourquoi générer du contenus textuels courts pour le SEO ?

En 2020, Artefact a constaté que leurs SEOs :

passent en moyenne 10 heures par mois à créer des méta descriptions, cela peut être traduit en coût :

30 SEOs x 10 heures x 80 USD = 24 000 USD/mois

Les techniques de machine learning, comme celle proposée par OnCrawl Labs, s’adaptent grâce au contenu de votre niche ou de votre secteur d’activité. Elles « apprennent » les bonnes tournures de phrase et le bon vocabulaire.

Pour les textes courts, comme les méta descriptions ou les titres de pages, les scripts de machine learning produisent un contenu de très haute qualité. Cela signifie que vous pouvez automatiser la création de méta descriptions, de titres, de descriptions de produits et de nombreux autres types de textes courts personnalisés, précis et de qualité pour les pages de votre site web.

Une fois le modèle préparé, le coût est très faible, même pour la création de dizaines voire de centaines de milliers de méta descriptions, qui peuvent se baser par exemple sur le nom du produit ou sur n’importe quelle autre information.

Pourquoi générer des textes pour les idées de contenu, les brouillons ou les fiches de rédaction ?

Pour les textes plus longs, le modèle proposé dans OnCrawl Labs produit des idées cohérentes et développées. Le contenu produit par notre modèle nécessitera toujours un travail de relecture par un être humain, tout comme n’importe quel autre brouillon.

Cela peut être un excellent moyen d’économiser du temps et de l’argent en réfléchissant à des idées de contenu uniques dans votre domaine spécifique ou en produisant des premières ébauches et des fiches de rédaction.

Le Guardian a publié un exemple de ce que les modèles GPT-3 (la prochaine version du modèle GPT-2 disponible sur OnCrawl Labs) peuvent faire. Mais gardez en tête que même la version que vous pouvez lire ici a également été retouchée par un rédacteur « humain », comme pour les articles écrits par n’importe quel journaliste du Guardian.

Ce dont vous avez besoin pour mettre en place la génération de texte

Le modèle de génération de texte dans OnCrawl Labs doit être formé afin que les textes soient parfaitement adaptés :

  • à votre langue
  • à votre marque
  • à votre industrie

Vous aurez besoin d’un vaste corpus de textes généraux dans votre langue, ainsi que de textes spécifiques à votre secteur d’activité et à votre site web. Plus il y en aura, mieux ce sera.

L’apprentissage d’un modèle de machine learning peut prendre du temps, selon le matériel informatique sur lequel vous essayez de le faire fonctionner et la taille de votre corpus.

Vous aurez également besoin d’un data scientist ou d’un ingénieur logiciel pour exécuter les opérations en suivant les étapes et le code fournis dans le cadre du projet OnCrawl Labs.

Pourquoi utiliser OnCrawl Labs pour la génération de textes ?

Il existe de nombreux modèles de génération de texte, et ce depuis des années. Google a maintes fois déconseillé d’utiliser des modèles de mauvaise qualité pour créer des contenus principaux.

Alors, qu’est-ce qui a changé ? En quoi le modèle d’OnCrawl est-il différent ?

Tout d’abord, la génération de textes par machine et le NLP (le traitement du langage naturel, ou comment les machines comprennent et produisent le langage humain) ont connu une révolution pendant les dernières années. Grâce à des avancées comme celles que nous constatons dans BERT (voici la version technique) et d’autres modèles similaires comme GPT-2 et GPT-3, la qualité que nous sommes capables de produire a grimpé en flèche.

De plus, comme l’explique Vincent Terrasi, chef de produit chez OnCrawl dans sa présentation à TechSEO Boost 2019, le modèle OnCrawl est le premier modèle accessible qui est capable de produire du contenu de qualité dans n’importe quelle langue et non uniquement en anglais. La recherche de Vincent pour ce modèle a été reconnue comme l’un des trois principaux axes de recherche en matière de SEO technique.

Comme pour la technologie de crawl, nous sommes convaincus que ce type de technologie est quelque chose qui ne doit pas être réservé aux plus grands acteurs mais qui devrait être à la disposition de tous. Pour nous, il était évident que vous, en tant qu’utilisateur d’OnCrawl, deviez avoir accès à un modèle de génération de texte de haute qualité.

Quelles sont d’autres utilisations possibles d’OnCrawl Labs ?

  • Trouver rapidement des performances anormales ou des erreurs
  • Projeter les comportements ou les résultats futurs
  • Et beaucoup plus !
Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :