Les sitemaps seo XML sont un élément vital des stratégies SEO technique. Ils aident les moteurs de recherche à parcourir votre site web plus efficacement.
Dans ce guide, j’approfondirai sur l’intérêt des sitemaps ou plan de site et comment vous pouvez les optimiser pour améliorer vos performances SEO.
En quoi consistent les sitemaps seo ?
Un sitemaps seo est un fichier qui fournit une liste d’URLs à crawler pour les moteurs de recherche, tels que Google, Bing et Yahoo. Les sitemaps XML peuvent contenir des attributs qui fournissent des informations supplémentaires sur chaque URL pour les crawlers.
Si vous n’êtes pas familier avec les sitemaps, je vous recommande de lire un autre article sur le blog Oncrawl : Sitemaps XML : le couteau suisse du SEO technique. L’article donne un bon aperçu des sitemaps seo pour les débutants, quelques cas d’utilisation de base et un sitemap en exemple.
Pourquoi les sitemaps XML sont-ils importants en SEO?
Il y a plusieurs raisons pour lesquelles les sitemaps XML sont importants pour le référencement , mais le résultat est que les sitemaps aident les moteurs de recherche à découvrir vos pages.
En fournissant un sitemap XML, vous vous assurez que les pages importantes de votre site web sont parcourues efficacement. En fait, Gary Illyes, analyste de tendances webmaster chez Google, a déclaré lors de la conférence Search Marketing à Sydney, que Googlebot utilise des sitemaps pour découvrir du contenu.
80% des découvertes suivent des liens, près de 20% ne font que suivre des sitemaps.
– Source
Vous pouvez également en savoir plus sur l’importance d’un sitemap XML en SEO sur le blog Oncrawl.
Le budget de crawl et les sitemaps en seo
Rappelez-vous qu’un sitemap fournit une liste d’URLs pour les moteurs de recherche à crawler. Il est donc essentiel que nous discutions de ce qu’est un budget de crawl et comment il affecte les sitemaps XML.
Voici comment Google définit le budget de crawl :
En prenant le taux de crawl et la demande de crawl ensemble, nous définissons le budget d’exploration comme le nombre d’URLs que Googlebot peut et veut crawler.
– Blog des webmasters Google
La chose importante à comprendre dans le contexte des sitemaps XML est que Googlebot ne va parcourir qu’un certain nombre d’URLs, et cela peut ne pas couvrir toutes vos pages web. Fournir des sitemaps XML peut utiliser votre budget de recherche plus efficacement parce que Googlebot saura mieux explorer les URLs importantes que vous leur fournissez dans le sitemap sur les pages de faible valeur.
Les sitemaps XML n’empêcheront pas Google de parcourir les URLs de faible valeur, mais ils donnent une indication des pages sur lesquelles Googlebot devrait se concentrer.
[Étude de cas] Optimiser les liens pour favoriser les pages les plus ROIstes
Soumettez vos sitemaps XML aux moteurs de recherche
Il est préférable de soumettre vos sitemaps XML aux moteurs de recherche via leurs outils pour webmaster. Si vous n’y avez pas accès, voici quelques guides pour les configurer :
Vous avez ainsi accès à des données pratiques, telles que les erreurs, la date de la dernière recherche et le nombre d’URL découvertes. Pour plus de détails, vous pouvez lire mon guide pour soumettre votre site web aux moteurs de recherche, tels que Google et Bing.
Fichier sitemap d’index
Un fichier d’index de sitemap est simplement un sitemap qui va lister vos sitemaps. Vous indiquez l’emplacement d’un fichier sitemap ainsi que sa dernière modification.
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod >2004-10-01T18:23:17+00:00< /lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex>
Fichier sitemap
Un fichier sitemap est une liste d’URL que vous voulez que Googlebot parcourt. Le fichier sitemaps xml contient des informations supplémentaires, telles que la date de la dernière modification, la fréquence à laquelle le contenu change et la priorité sur une échelle de 0,0 à 1,0.
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
6 conseils pour optimiser votre sitemap XML
En plus d’avoir un sitemap XML, il y a plusieurs choses que vous pouvez faire pour l’optimiser afin d’améliorer vos performances SEO.
1. Suivez le protocole sitemaps.org
Avant d’examiner les conseils d’optimisation, il est essentiel que vos sitemaps suivent le protocole sitemps.org pour que les moteurs de recherche les comprennent.
Pour que votre sitemap XML soit supporté par les principaux moteurs de recherche, il doit :
- Commencer par une balise d’ouverture <urlset> et terminer par une balise de fermeture </urlset>.
- Spécifier l’espace de noms (protocole standard) dans la balise <urlset>.
- Inclure une entrée <url> pour chaque URL, comme balise XML parent.
- Inclure une entrée <loc> enfant pour chaque balise parent <url>.
2. Structurer les sitemaps XML par section de site
Un de mes cas d’utilisation préférés pour les sitemaps XML est de surveiller les URLs valides et exclues par section de site dans Google Search Console après avoir soumis vos sitemaps à Google.
Pour ce faire, vous devez créer des fichiers d’index sitemap pour chaque section de votre site web. Voici un exemple de ce à quoi cela peut ressembler :
Index.xml
products-index.xml
product.xml
product1.xml
blog-index.xml
blog.xml
blog-1.xml
some-directory-index.xml
directory.xml
directory-1.xml
3. N’incluez que vos » money pages « .
Vous ne devez inclure dans vos fichiers XML sitemap que des URLs que vous voulez que Googlebot explore, indexe et classe. Ces pages sont souvent appelées « money pages » parce que ce sont elles qui vous rapportent de l’argent.
Il n’y a aucune raison de fournir des URLs dans votre sitemap qui ne fournissent aucun avantage SEO à votre site web.
4. Évitez les codes d’état HTTP non-200
Évitez d’inclure des URLs qui renvoient du code de réponse HTTP non-200 dans votre sitemap XML. Inclure une réponse non-200 est mauvais pour votre SEO car vous dites à Googlebot que vous voulez que ces URLs soient crawlées même si elles gaspillent votre budget de recherche.
5. Évitez les URL non indexées
Les URLs marquées en noindex n’ont pas leur place dans vos sitemaps XML (autres que les cas d’utilisation spécifiques). Les URLs qui sont en noindex ne vous apporteront pas de trafic à partir des moteurs de recherche, il n’y a donc aucune raison pour que le Googlebot les parcourent après qu’elles aient été supprimées de l’index.
Note : vous pouvez utiliser un sitemap XML temporaire si vous voulez que Google voit rapidement une balise noindex sur un grand nombre d’URLs.
6. Éviter d’inclure les URLs non-canoniques
Les URLs qui indiquent une URL canonique différente n’ont pas non plus leur place dans votre sitemap XML. Tout comme noindex, vous ne voulez pas que ces URLs se classent sur Google, donc il n’y a aucune raison de dire à Googlebot de les parcourir.