Data scraping disponible avec nos custom fields

Scrape-your-websites-data-with-our-custom-fields-250px
Share :
Accueil > SEO Technique > Data scraping disponible avec nos custom fields

Vous recherchez un moyen efficace d’extraire et d’analyser des données spécifiques de votre site web ? La fonctionnalité de custom fields d’Oncrawl vous permet de récupérer n’importe quel contenu de vos pages lors d’un crawl, vous offrant ainsi une flexibilité totale pour collecter les informations exactes dont vous avez besoin pour votre analyse SEO.

Que sont les custom fields ?

Les custom fields vous permettent d’extraire des attributs spécifiques de vos pages web et de les analyser directement dans le Data Explorer. Cette fonctionnalité vous permet de créer vos propres colonnes de données personnalisées : tout ce que vous pouvez identifier dans le code source de votre page peut être suivi et analysé.

Pourquoi utiliser les custom fields?

Les possibilités sont quasiment illimitées, mais voici quelques cas pratiques courants :

  • Informations sur l’e-commerce : collecter les prix des produits, les évaluations ou l’état des stocks
  • Analyse de contenu : compter les commentaires, les partages sur les réseaux sociaux ou les emplacements publicitaires sur les articles
  • Vérification technique : vérifier si les balises d’analyse, les pixels publicitaires ou les codes de suivi sont correctement implémentés sur votre site
  • Expérience utilisateur : extraire et analyser les chemins de navigation, les recommandations de produits similaires ou les données de recherche sur le site
  • Validation des données structurées : vérifier l’implémentation et la cohérence du balisage Schema

Comment cela fonctionne-t-il ?

La configuration des custom fields est simple :

  1. Activez le scraping des données dans vos paramètres de crawl.
  2. Définissez vos règles d’extraction à l’aide d’expressions REGEX ou XPATH.
  3. Configurez les transformations pour formater vos données exactement comme vous le souhaitez.
  4. Lancez votre crawl pour collecter les données.
  5. Analysez vos résultats dans Data Explorer avec vos nouvelles colonnes personnalisées.

Choisir votre méthode d’extraction

Oncrawl supporte deux méthodes d’extraction efficaces :

REGEX (expressions régulières) : idéales pour capturer des modèles de texte spécifiques, tels que des dates, des prix ou des identifiants de produits.

XPATH : Idéal pour extraire du contenu basé sur la structure HTML, tel que le texte des titres, les attributs alt des images ou les valeurs des métadonnées. Si vous êtes familier avec les sélecteurs CSS, XPATH offre des fonctionnalités similaires.

Scraping_Oncrawl

Vous pouvez même combiner plusieurs étapes, en appliquant chaque règle aux résultats de la précédente pour des extractions complexes.

Options de transformation et d’exportation

Une fois vos données extraites, personnalisez leur traitement et leur stockage :

  • Supprimer les valeurs vides
  • Normaliser les URLs
  • Compter les occurrences au lieu de lister les valeurs
  • Convertir les entités HTML en caractères affichables
  • Choisir entre conserver toutes les valeurs ou uniquement la première valeur correspondante
  • Exporter sous forme de chaînes, nombres, décimales, booléens ou valeurs date/heure

Commencer l’extraction des données personnalisées

Grâce aux custom fields, vous pouvez transformer votre analyse de crawl en une extraction de données personnalisée qui répond à vos besoins spécifiques. Que vous effectuez du monitoring des indicateurs d’e-commerce, validiez des implémentations techniques ou effectuiez une analyse approfondie du contenu, les custom fields vous fournissent les données dont vous avez besoin.

Share :
Julie Quintard
Sujets en lien :

Découvrez ce qu'Oncrawl peut faire pour vous

Demander une démo