Question 1

Qu'est-ce qu'un sitemap ?

Accepted Answer

Un sitemap est un fichier XML listant chaque URL que vous souhaitez que les moteurs de recherche crawlent et indexent. Il réside à yoursite.com/sitemap.xml et agit comme un annuaire pour les crawlers, particulièrement utile pour les gros sites, les nouveaux sites avec peu de backlinks, ou les sites avec une navigation profonde où les pages se trouvent à cinq clics ou plus de la page d'accueil. Les sitemaps ne garantissent pas l'indexation. Google décide toujours si une page vaut la peine d'être indexée en fonction de la qualité et de la duplication. Sans sitemap, Google s'appuie sur les liens internes et les backlinks externes pour trouver les pages, ce qui peut prendre des semaines ou même des mois pour le nouveau contenu. Avec un sitemap, vous dites à Google que la page existe et quand elle a été mise à jour pour la dernière fois, ce qui accélère la découverte et aide à prioriser le contenu frais. Notre vérificateur de sitemap récupère votre sitemap.xml, parse la structure, valide la syntaxe XML, vérifie les codes de statut HTTP pour chaque URL listée, signale les doublons et détecte les pages orphelines (pages dans votre sitemap mais inaccessibles via les liens internes). Utilisez-le après le lancement d'un nouveau site, après une migration, ou trimestriellement pour détecter les régressions.

Question 2

Comment vérifier si mon site Web a un sitemap ?

Accepted Answer

Essayez trois emplacements. D'abord, ajoutez /sitemap.xml à votre domaine (yourdomain.com/sitemap.xml) et voyez s'il se charge. La plupart des CMS génèrent un sitemap à ce chemin automatiquement. Si vous voyez du XML avec une liste d'URL, c'est votre sitemap. Deuxièmement, vérifiez robots.txt à yourdomain.com/robots.txt pour une ligne commençant par Sitemap: suivie d'une URL. De nombreux sites déclarent l'emplacement de leur sitemap ici. Troisièmement, connectez-vous à Google Search Console, allez à Sitemaps sous Index, et voyez quelles URL de sitemap vous avez soumises. C'est la liste faisant autorité que Google utilise pour prioriser le crawling. Si vous trouvez une URL de sitemap, collez-la dans notre champ Sitemap URL pour valider la structure, confirmer que tous les codes de statut d'URL retournent 200 et repérer les doublons ou les pages orphelines. Si aucune de ces méthodes ne trouve un sitemap, vous n'en avez probablement pas. C'est correct pour les sites de moins de 50 pages mais c'est un problème pour les plus grands. Générez-en un en utilisant votre plugin CMS (Yoast, Rank Math, next-sitemap), puis soumettez-le à Search Console pour accélérer l'indexation.

Question 3

Quels sont les trois types de sitemaps ?

Accepted Answer

Les trois types sont les sitemaps XML (pour les moteurs de recherche), les sitemaps HTML (pour les utilisateurs) et les sitemaps visuels (pour les concepteurs). Les sitemaps XML sont des fichiers lisibles par machine au format XML qui listent les URL, les dates de dernière modification, la fréquence de mise à jour et la priorité. Les moteurs de recherche les utilisent pour découvrir et prioriser les pages. Ils résident à /sitemap.xml et ne sont pas destinés à être consultés par l'homme. Les sitemaps HTML sont des pages lisibles par l'homme avec des liens vers chaque section majeure de votre site, organisées hiérarchiquement. Elles aident les utilisateurs à naviguer dans les gros sites et fournissent des liens internes. Elles résident à des URL comme /sitemap et sont souvent liées depuis le pied de page. Les sitemaps visuels sont des diagrammes (dans Figma, Miro, Sketch) qui cartographient la hiérarchie des pages, les flux des utilisateurs et la navigation avant la construction d'un site. Ce sont des artefacts de planification, pas des pages en direct. La plupart des sites ont besoin d'un sitemap XML (requis pour le SEO) et bénéficient d'un sitemap HTML s'il y a plus de 100 pages. Les sitemaps visuels sont pour la phase de conception. Notre vérificateur valide uniquement les sitemaps XML. La plupart des CMS les génèrent automatiquement. Pour les sites statiques, utilisez next-sitemap ou astro-sitemap.

Question 4

Comment valider un sitemap ?

Accepted Answer

Valider un sitemap signifie vérifier la structure XML, l'accessibilité des URL, la précision des métadonnées et les limites de protocole. D'abord, confirmez que le XML est bien formé avec la bonne déclaration d'espace de noms (attribut xmlns pointant vers sitemaps.org). Un XML mal formé fait que les analyseurs rejettent le fichier entier. Deuxièmement, vérifiez que chaque URL retourne un code de statut 200, pas un 301, 404 ou erreur 5xx. Les moteurs de recherche peuvent toujours crawler les URL redirigées ou cassées, mais ils les déprioritisent. Troisièmement, vérifiez que les URL utilisent des chemins absolus ( https://example.com/page , pas /page) et correspondent à votre domaine canonique (www ou non-www, pas mélangé). Quatrièmement, confirmez que la taille du fichier est inférieure à 50 Mo décompressé avec moins de 50 000 URL. Si vous dépassez l'un ou l'autre, divisez en plusieurs sitemaps et utilisez un fichier d'index de sitemap. Cinquièmement, validez que les dates lastmod utilisent le format W3C (YYYY-MM-DD ou ISO 8601). Notre outil automatise les cinq : collez votre Sitemap URL , choisissez crawl depth (index only, all referenced sitemaps, ou sample), et nous retournons les codes de statut, les doublons, les avertissements lastmod manquants et une exportation CSV des problèmes.

Question 5

Google a-t-il un générateur de sitemap ?

Accepted Answer

Google offrait autrefois un générateur de sitemap (Google Sitemap Generator) pour Apache et IIS, mais il a été déprécié il y a des années. Vous n'en avez plus besoin. Presque tous les CMS modernes et les frameworks statiques génèrent des sitemaps automatiquement. WordPress (via Yoast SEO, Rank Math, ou sitemap principal depuis 5.5), Shopify (intégré), Webflow (intégré), Squarespace (intégré), Wix (intégré), Next.js (via next-sitemap), Astro (via astro-sitemap), Gatsby (via gatsby-plugin-sitemap) et Hugo (intégré) créent tous et mettent à jour les sitemaps XML sans travail manuel. Pour les sites personnalisés, utilisez des bibliothèques open-source comme sitemap.js (Node.js), django-sitemap (Python) ou un script de construction. Une fois que vous avez un sitemap, soumettez-le à Google Search Console sous Sitemaps. Google le crawlera périodiquement. Vous pouvez faire un ping à Google manuellement après avoir ajouté des URL en envoyant une requête GET à google.com/ping?sitemap=yoursitemapurl, bien que la plupart des CMS le fassent automatiquement. Utilisez notre vérificateur de sitemap pour valider le sitemap avant de le soumettre à Search Console.

Question 6

À quelle fréquence dois-je mettre à jour mon sitemap ?

Accepted Answer

Mettez à jour votre sitemap chaque fois que vous publiez, dépubliez ou modifiez considérablement une page. La plupart des CMS et des générateurs statiques gèrent cela automatiquement. Les plugins WordPress régénèrent le sitemap à chaque publication de message, Shopify le met à jour quand les produits changent, et les frameworks statiques reconstruisent le sitemap lors de chaque déploiement. Si vous gérez manuellement (rare sur les sites personnalisés), régénérez-le hebdomadairement ou après des lots de contenu. Le champ lastmod indique aux moteurs de recherche quand une page a changé, ce qui les aide à prioriser le contenu frais par rapport au contenu obsolète. Si vous ne mettez jamais à jour lastmod ou définissez la même date pour chaque URL, les moteurs de recherche l'ignorent et font appel à la découverte de liens et au budget de crawl. Pour les éditeurs quotidiens (nouvelles, blogs, e-commerce avec changements d'inventaire), les sitemaps dynamiques qui régénèrent lors de la publication sont essentiels. Pour les éditeurs mensuels ou trimestriels, un sitemap statique régénéré lors du déploiement est correct. Ne laissez pas votre sitemap lister les URL qui 404, redirigent ou sont bloquées par robots.txt. Cela gaspille le budget de crawl et signale une faible qualité du site. Utilisez notre vérificateur après les changements majeurs (migration, restructuration d'URL, changements de contenu en masse).

Question 7

Quelle est la différence entre un sitemap et robots.txt ?

Accepted Answer

Robots.txt indique aux crawlers quelles parties de votre site ils sont autorisés ou non à accéder. Un sitemap indique aux crawlers quelles pages vous souhaitez qu'ils priorisent le crawling. Ils servent des objectifs différents et travaillent ensemble. Robots.txt réside à yourdomain.com/robots.txt, utilise la syntaxe en texte brut avec les directives User-agent, Allow et Disallow, et bloque ou autorise l'accès aux chemins, fichiers ou répertoires. Il déclare où réside votre sitemap via une directive Sitemap:. Robots.txt est crawlé en premier. Si vous interdisez accidentellement votre site entier, les crawlers s'arrêtent immédiatement et ne voient jamais votre sitemap. Un sitemap réside à yourdomain.com/sitemap.xml, utilise la syntaxe XML et liste les URL que vous souhaitez crawler avec des métadonnées comme lastmod et priority. Il ne contrôle pas l'accès. Il suggère ce qu'il faut crawler. Les crawlers peuvent ignorer votre sitemap s'ils trouvent des pages via des liens, mais ils ne peuvent pas contourner robots.txt. Utilisez robots.txt pour bloquer les panneaux d'administration, les environnements de staging et les crawlers indésirables. Utilisez un sitemap pour lister chaque page indexable.

Question 8

Un sitemap peut-il améliorer mon SEO ?

Accepted Answer

Un sitemap n'améliore pas directement les classements, mais il supprime les frictions de découverte, ce qui aide indirectement le SEO en s'assurant que les pages nouvelles et mises à jour sont crawlées plus rapidement. Sans sitemap, Google s'appuie sur les liens internes et les backlinks externes pour trouver les pages, ce qui peut prendre des semaines pour le nouveau contenu, en particulier sur les gros sites ou les sites avec un linking interne faible. Avec un sitemap, vous dites à Google que la page existe et quand elle a été mise à jour pour la dernière fois, ce qui accélère l'indexation. C'est important pour les nouveaux sites avec peu de backlinks, les sites avec des hiérarchies de pages profondes (pages enfouies à cinq clics de la page d'accueil), les sites avec des pages orphelines et les sites qui publient fréquemment (blogs, actualités, e-commerce). Un sitemap aide à l'efficacité du budget de crawl. Au lieu de découvrir des pages via le crawl de liens, Google lit votre sitemap et sait ce qu'il faut prioriser. Cependant, un sitemap ne peut pas forcer Google à indexer les pages de faible qualité, dupliquées ou minces. Si une page est dans votre sitemap mais toujours non indexée, le problème est généralement la qualité du contenu, la canonicalisation ou les balises meta robots.

Question 9

Que ne doit pas être dans un sitemap ?

Accepted Answer

Un sitemap ne doit lister que les URL que vous souhaitez indexer, donc excluez tout ce qui est bloqué par robots.txt, marqué avec noindex, redirigé vers une autre URL, retournant 404 ou erreurs 5xx, ou canonicalisé vers une autre URL. Inclure ceux-ci gaspille le budget de crawl et signale une mauvaise maintenance du site. Ne pas inclure les pages d'administration, les pages de connexion, les pages de paiement ou les tableaux de bord de comptes utilisateur (habituellement bloqués par robots.txt ou noindex). Ne pas inclure les URL de paramètres (comme ?sort=price ou ?page=2) si vous utilisez les balises canoniques pour les consolider. Ne pas inclure les environnements de staging ou de test. Ne pas inclure les URL qui redirigent (301 ou 302). Listez la destination finale à la place. Ne pas inclure les URL avec les balises meta noindex ou les en-têtes X-Robots-Tag. Ne pas inclure les URL paginées à moins que chaque page ait un contenu unique qui vaut la peine d'être indexé. La plupart des sites e-commerce ne devraient inclure que la page 1, avec les balises rel=next/prev ou canoniques gérant le reste. Ne pas inclure les URL de contenu dupliqué. Utilisez les balises canoniques pour consolider les doublons, puis listez uniquement la version canonique.

Question 10

Comment corriger les erreurs de sitemap ?

Accepted Answer

Les erreurs de sitemap se divisent en trois groupes : structurels (XML mal formé, espace de noms incorrect, fichier trop volumineux), au niveau des URL (404, redirections, pages noindex) et problèmes de métadonnées (lastmod manquant, formats de date incorrects). Corrigez d'abord les erreurs structurelles. Elles empêchent les crawlers de parser le fichier. Ouvrez votre sitemap dans un navigateur ou un validateur XML, confirmez qu'il commence par la bonne déclaration XML et l'espace de noms (xmlns=" http://www.sitemaps.org/schemas/sitemap/0.9 ") et vérifiez que chaque balise d'ouverture a une balise de fermeture correspondante. Si votre sitemap dépasse 50 Mo ou 50 000 URL, divisez-le en plusieurs fichiers et créez un fichier d'index de sitemap. Corrigez les erreurs au niveau des URL en supprimant ou en remplaçant les entrées cassées. Supprimez toute URL qui retourne 404, remplacez les URL redirigées par leur destination finale, supprimez les URL avec les balises noindex et confirmez que chaque URL correspond à votre domaine canonique (www ou non-www, pas mélangé). Corrigez les problèmes de métadonnées en vous assurant que les dates lastmod utilisent le format ISO 8601 (YYYY-MM-DD ou YYYY-MM-DDTHH:MM:SS+00:00). Supprimez lastmod entièrement si votre CMS ne peut pas le garder précis. Après la correction, revalidez avec notre outil et resoumettez à Google Search Console.

Sitemap Checker

Generate the whole content, not just check it.

Ce qu'un vérificateur de sitemap fait réellement

Comment utiliser ce vérificateur de sitemap

Pourquoi les codes de statut comptent plus que la validité XML

URL dupliquées et incompatibilités canoniques

Pages orphelines et crawlabilité

Erreurs courantes

Conseils avancés

Generate the whole content, not just check it.

Questions fréquemment posées

Outils gratuits associés