OnCrawl Labs : une plateforme R&D pour le SEO, la data science et le machine learning

22 avril 2020 - 5  min de lecture - par Rebecca Berbel
Accueil > Product update > OnCrawl Labs: une plateforme R&D pour le SEO

OnCrawl a lancé une nouvelle plateforme de R&D explorant l’optimisation technique des moteurs de recherche, de la data science et du machine learning : OnCrawl Labs.

Qu’est-ce que OnCrawl Labs ?

OnCrawl Labs est une plateforme qui offre un portefeuille d’algorithmes comme solutions pour répondre aux questions stratégiques de référencement.

Créé pour ceux qui ont des compétences avancées en matière de SEO, OnCrawl Labs est destiné aux personnes curieuses de savoir ce que la data science peut apporter au SEO technique. La plateforme est conçue pour offrir le plus grand impact à ceux qui ont soit une connaissance de base de la data science, soit qui peuvent collaborer avec d’autres personnes dans des rôles liés à la data science.

Utilisant Google Colab et dans les langages Python et R, les projets de OnCrawl Labs fournissent un contexte détaillé, des explications et une documentation pour chaque carnet, qui peut être utilisé tel quel à titre d’exemple ou adapté au site web de tout utilisateur.

Cela permet à OnCrawl d’offrir un aperçu des coulisses de la recherche et du développement effectués par nos équipes. Mais surtout, cela nous permet de proposer des fonctionnalités qui ne sont pas encore disponibles sur le marché du SEO.

Que contient OnCrawl Labs ?

Au moment de sa sortie, OnCrawl Labs comprend trois projets complets de data science et de machine learning ainsi que leur documentation. Pour l’été 2020, deux autres projets sont en cours de production.

Indexation en temps réel

Indexez vos nouvelles URL prioritaires dès qu’elles sont découvertes par un crawl en les soumettant à l’aide de l’API Bing, ou facilitez leur découverte en les incluant dans vos sitemaps pour Google.

Faire indexer de nouvelles pages est un défi pour les référenceurs dans les secteurs où les sites évoluent fréquemment, en particulier le e-commerce, les petites annonces et les éditeurs en ligne, où la visibilité rapide des nouvelles pages dans les moteurs de recherche a une incidence directe sur l’activité.

Les principaux moteurs de recherche offrent des moyens de soumettre manuellement des pages à l’indexation. Toutefois, dans les cas d’utilisation décrits ci-dessus, cela peut nécessiter que les équipes SEO tiennent à jour des listes quotidiennes de pages créées parfois automatiquement par les équipes de production et de contenu. L’obtention d’une liste complète peut être difficile. Selon le nombre de nouvelles pages, la soumission manuelle n’est souvent pas une option réalisable.

La soumission automatique en temps réel permet de résoudre ces problèmes.

Ce projet a été publié avec la sortie d’OnCrawl Labs.

Génération de texte SEO

Testez la méthode Transformers avec vos propres données et générez de nouveaux textes qualitatifs dans n’importe quelle langue.

Un bon référencement nécessite un bon contenu, mais la création de contenu est sans doute l’un des éléments les plus coûteux de la création et de la maintenance d’un site web.

En utilisant les méthodes présentées à TechSEO Boost plus tôt cette année, exploitez une partie de la technologie derrière BERT pour automatiser la création en masse de textes courts, tels que les méta descriptions, les ancres et les titres, avec le niveau de qualité de langage naturel requis pour un CRO et un SEO efficaces.

Ce projet a été publié avec la sortie d’OnCrawl Labs.

Rapport d’anomalie

Utilisez des méthodes d’apprentissage non supervisées pour détecter les sous-performances et les sur-performances de toute mesure d’optimisation des moteurs de recherche suivie avec OnCrawl.

La détection d’anomalies vous permet de savoir si un changement observé lors d’un audit se situe dans la fourchette « normale » pour le site web, ou si le changement représente un événement inhabituel qui doit être pris en compte.

En même temps, l’utilisation de l’apprentissage automatique pour trouver les anomalies révélées par les crawls a l’avantage de vous permettre de prendre en compte les événements saisonniers, ainsi que les changements progressifs du site web au fil du temps.

L’examen des anomalies peut également révéler si certaines mesures sont essentielles pour le référencement d’un site web, et qui ne sont que accessoires.

Ce projet a été publié avec la sortie d’OnCrawl Labs.

Prévision SEO pour les tendances longue traîne

Réalisez des prévisions SEO pour les tendances longue traîne futures avec l’algorithme Facebook Prophet.

Les mots-clés de longue traîne sont très importants dans une stratégie SEO car ensemble ils apportent souvent plus de trafic que n’importe lequel des mots-clés populaires et à concurrence élevée. Par contre, comme ils se basent sur un nombre peu important de recherches, il est donc difficile de les prédire et surtout de les anticiper.

Avec la prévision longue traîne :

  • Soyez confiants vis-à-vis de vos investissements
  • Équilibrez plus simplement les dépenses entre le budget SEO et les investissements PPC

Ce projet a été publié pendant l’été 2020.

Générateur de liens internes

Accédez à des aperçus pour améliorer les liens internes et générer des listes de candidats pour l’ajout / la suppression de liens internes.

Ce projet sera publié cet été.

Comment OnCrawl Labs aide OnCrawl ?

OnCrawl Labs est avant tout un laboratoire d’idées.

OnCrawl perfectionnera et développera les projets populaires afin d’apporter de nouvelles fonctionnalités à la plateforme OnCrawl. Les sujets et les commentaires des utilisateurs de OnCrawl Labs aideront également à définir et à hiérarchiser la feuille de route des produits OnCrawl.

Comment accéder à OnCrawl Labs

L’accès à la plate-forme OnCrawl Labs est gratuit pour tous les utilisateurs d’OnCrawl. Si vous êtes déjà un utilisateur de OnCrawl, vous pouvez trouver OnCrawl Labs ici.

La possibilité d’examiner, de copier et d’adapter le contenu de tous les projets de la plateforme pour votre propre usage est incluse dans l’option OnCrawl API.

 

Rebecca travaille comme Product Marketing Manager chez Oncrawl. Elle est passionnée de NLP et de modèles informatiques de langage, ainsi que des systèmes de tout type et leur fonctionnement. Elle n'est jamais en manque de sujets techniques à partager, et elle croit dans l'importance de l'évangelisation des technologies et de l'utilisation des données pour mieux comprendre le référencement. Elle contribue régulièrement au blog Oncrawl.
Sujets en lien :