Êtes-vous à la recherche d’un moyen pratique de récolter et classer les diverses données de votre site ? Si c’est le cas, sachez que la toute nouvelle fonctionnalité d’OnCrawl vous permet d’extraire tout type de contenu recherché sur votre site. Créez vos propres filtres avec nos custom fields (champs personnalisés) et retrouvez-les facilement dans votre Data Explorer.
Notre fonctionnalité custom fields propose différentes utilisations pratiques :
Ces différentes utilisations ne sont que des exemples. Grâce à notre nouvelle fonctionnalité, les possibilités sont infinies.
Nos custom fields peuvent être programmés dans vos paramètres crawl :
Nous prenons en charge deux types d’expression : soit une expression rationnelle (regex – voir le guide) ou une expression XPath (voir le guide). Ce choix est important parce qu’il influence la façon dont la règle sera exprimée et traitée.
Sample : <meta itemprop=”ratingValue” content=”4.5″>
Rules : <meta itemprop=”ratingValue” content=”([0-9]+(\.[0-9]*)?)“>
Output : 4.5
Sample : <meta itemprop=”ratingValue” content=”4.5″>
Rules : string(//meta[@itemprop=’ratingValue’]/@content)
Output : 4.5
Cette extraction est parfaite pour extraire le prix d’un produit ou un commentaire
Celle-ci peut être utilisée pour extraire une liste de produits similaires
Ce type d’extraction est bien adapté pour vérifier les analyses sur votre trafic ou vos balises publicitaires.
Cette règle est parfaite pour compter le nombre de commentaires sur un article ou le nombre d’annonces dans une page.
Les formats du champ sont importants, car ils permettent d’activer les opérateurs de requêtes dans notre OQL (OnCrawl Query Language) ainsi qu’à effectuer le tri des valeurs dans les onglets du Data Explorer.
À noter : en fonction du type d’extraction, ce choix est désactivé: ‘check if exists’ → il impose au champ d’être un champ booléen et où ‘Length’ et ‘Number of occurrences’ forcent le champ à être un champ entier.
Sample : <strong class=”product-price”>249<sup>€99</sup></strong>
Rules : <strong[^>]+>\s*([0-9]+)€([0-9]+)\s*
Field format : Formatted value
Formatted value : {0}.{1}€
Output : 249.99€
Vous devez ajouter un nom à vos champs nouvellement créés pour les trouver facilement dans le Data Explorer.
Vous pouvez tester directement la règle en appuyant sur le bouton “Check” avec un échantillon de pages différentes ou en copiant une section du code HTML pour vous assurer que tout fonctionne comme prévu.
Ensuite, allez dans votre Data Explorer, cliquez sur ‘add columns’ et sélectionnez le champ personnalisé que vous avez créé.
Vous pouvez également directement trier vos URLs par Custom Fields. Sélectionnez ‘Set your filter’ et le champ personnalisé que vous venez de créer. Ensuite, définissez votre requête (‘True’ ou ‘False’ ici) et cliquez sur ‘Apply Filters’.
Vos URLs ne sont triées que par les champs personnalisés demandés :
Vous êtes maintenant prêt à jouer avec vos nouveaux filtres !
Nos custom fields sont disponibles en option à partir du Plan Pro. Vous voulez les essayer ?
Et contactez-nous pour que nous activions vos custom fields.