Que dit Google sur le SEO ? /
Quiz SEO Express

Testez vos connaissances SEO en 5 questions

Moins d'une minute. Decouvrez ce que vous savez vraiment sur le referencement Google.

🕒 ~1 min 🎯 5 questions

Declaration officielle

Un fichier sitemap situé dans un sous-répertoire est par défaut valable uniquement pour les URLs de ce sous-répertoire. Le placement du sitemap, qu'il soit dans le sous-répertoire ou à la racine du domaine principal, n'importe pas si bien configuré dans Search Console.
10:26
🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 1h01 💬 EN 📅 20/09/2016 ✂ 15 déclarations
Voir sur YouTube (10:26) →
Autres déclarations de cette vidéo 14
  1. 1:49 RankBrain peut-il pénaliser votre site comme Panda ou Penguin ?
  2. 7:00 Le contenu dupliqué sur plusieurs canaux peut-il tuer votre visibilité organique ?
  3. 9:15 Les liens des réseaux sociaux ont-ils un impact sur votre positionnement Google ?
  4. 15:03 Faut-il vraiment indexer vos URLs d'images hébergées sur CDN ?
  5. 23:42 Republier son contenu sur Medium ou LinkedIn : erreur stratégique ou opportunité SEO ?
  6. 25:26 La balise canonical accumule-t-elle vraiment tous les signaux SEO comme un lien ?
  7. 30:03 Google utilise-t-il vos données Analytics pour vous classer ?
  8. 32:13 Comment gérer les URLs multiples pour un même produit sans tuer votre SEO ?
  9. 53:06 Pourquoi certains mots clés ne récupèrent-ils jamais après une pénalité Penguin ?
  10. 56:33 Le schema markup des avis doit-il vraiment se limiter aux pages produits ?
  11. 59:19 Faut-il utiliser la balise canonical pour les contenus syndiqués ?
  12. 73:45 Pourquoi une refonte de site avec migration HTTPS peut-elle plomber votre trafic organique ?
  13. 78:24 Pourquoi le cache Google affiche-t-il parfois un contenu différent du rendu textuel réel ?
  14. 80:40 Le titre de page est-il vraiment un facteur de classement direct ?
📅
Declaration officielle du (il y a 9 ans)
TL;DR

Un sitemap placé dans un sous-répertoire ne couvre par défaut que les URLs de ce même sous-répertoire. Cette limitation technique est facilement contournable via Search Console : le placement physique du fichier importe peu si la configuration est correcte. Pour les praticiens SEO, cela signifie qu'un sitemap dans /blog/ ne pourra référencer que /blog/*, sauf déclaration explicite dans GSC.

Ce qu'il faut comprendre

Quelle est la portée par défaut d'un sitemap placé dans un sous-répertoire ?

La déclaration de Mueller précise une règle souvent méconnue : un fichier sitemap stocké dans un sous-répertoire possède une portée limitée par défaut. Concrètement, si vous déposez sitemap.xml dans example.com/blog/, ce fichier ne pourra référencer que des URLs commençant par example.com/blog/.

Cette restriction s'explique par des considérations de sécurité et de permissions. Google considère qu'un fichier situé dans /blog/ n'a pas l'autorité pour déclarer des URLs situées à la racine ou dans d'autres répertoires. Un sous-dossier ne peut pas « prétendre » représenter l'ensemble du domaine sans validation explicite.

Comment Search Console change-t-il cette limitation ?

Mueller précise que le placement physique devient secondaire si le sitemap est correctement configuré dans Google Search Console. Une fois déclaré manuellement dans GSC, le fichier peut référencer n'importe quelle URL du domaine vérifié, peu importe son emplacement physique.

Cette souplesse s'avère particulièrement utile dans les architectures complexes où différents sous-répertoires sont gérés par des équipes ou systèmes distincts. Un sitemap technique peut vivre dans /seo-tools/ tout en couvrant l'ensemble du site, à condition d'être enregistré dans GSC avec les permissions appropriées.

Cette règle s'applique-t-elle aussi au fichier robots.txt ?

La déclaration via robots.txt suit exactement la même logique. Si vous indiquez « Sitemap: https://example.com/blog/sitemap.xml » dans votre robots.txt à la racine, vous donnez explicitement l'autorisation à ce fichier de couvrir tout le domaine.

Sans cette déclaration explicite (robots.txt ou GSC), le sitemap reste cantonné à son périmètre de sous-répertoire. Cette double couche de validation — emplacement physique ET déclaration explicite — constitue un mécanisme de sécurité contre les injections de sitemaps malveillants.

  • Un sitemap dans un sous-répertoire ne couvre que ce sous-répertoire par défaut
  • La déclaration dans Search Console ou robots.txt élargit cette portée à l'ensemble du domaine vérifié
  • Cette restriction vise à empêcher qu'un accès partiel au serveur permette de manipuler l'indexation globale
  • Le placement physique importe peu une fois la configuration GSC correctement effectuée
  • Même règle pour les sitemaps d'images, vidéos ou actualités

Avis d'un expert SEO

Cette limitation est-elle réellement appliquée dans la pratique ?

Les tests terrain confirment que Google applique strictement cette règle pour les sitemaps découverts automatiquement. Si Googlebot trouve un sitemap.xml dans /ressources/ sans déclaration explicite, il ignorera les URLs situées hors de ce répertoire. J'ai observé ce comportement sur plusieurs audits où des URLs racines n'étaient pas crawlées malgré leur présence dans un sitemap « orphelin ».

En revanche, la souplesse de Search Console est réelle. Une fois le sitemap enregistré manuellement dans GSC, Google respecte la portée déclarée indépendamment du chemin physique. Cette approche permet des configurations hybrides utiles pour les gros sites avec architecture distribuée.

Quels pièges guettent les SEO mal informés ?

Le piège classique : déployer un sitemap dans un sous-dossier, l'indexer correctement dans GSC, puis changer d'URL sans mettre à jour la déclaration. Le nouveau fichier sera découvert mais limité à son sous-répertoire, créant un trou dans la couverture d'indexation. [A vérifier] sur les sites avec multiples migrations de sitemaps.

Autre confusion fréquente : croire que la présence dans robots.txt suffit. Si le robots.txt pointe vers /blog/sitemap.xml mais que ce fichier liste des URLs racines, Google les crawlera... mais pourrait appliquer un trust réduit comparé à un sitemap déclaré depuis la racine ET dans GSC. Cette double validation renforce la légitimité du fichier.

Cette règle diffère-t-elle selon les types de sitemaps ?

La logique s'applique identiquement aux sitemaps d'index, d'images, de vidéos et d'actualités. Un sitemap vidéo dans /media/video-sitemap.xml ne pourra référencer que des URLs /media/* sauf déclaration explicite. Cette cohérence simplifie la gouvernance SEO des gros sites.

Point intéressant : les sitemaps générés dynamiquement (exemple : /sitemap.php?type=blog) suivent la même règle selon leur URL apparente, pas leur logique serveur. Si l'URL affichée est /blog/sitemap.php, la limitation s'applique même si le script PHP génère des URLs globales. Seule compte l'URL telle que Google la voit.

Impact pratique et recommandations

Où placer concrètement ses fichiers sitemap ?

La meilleure pratique reste le placement à la racine du domaine : example.com/sitemap.xml pour le sitemap principal, avec des sitemaps d'index si nécessaire. Cette approche évite toute ambiguïté et fonctionne même si la configuration GSC est accidentellement supprimée.

Pour les architectures multi-sections (blog, e-commerce, documentation), privilégiez un sitemap d'index à la racine pointant vers des sitemaps thématiques : /blog/sitemap.xml, /shop/sitemap.xml. Déclarez chaque fichier individuellement dans GSC pour garantir une couverture complète et trackable.

Comment vérifier que la configuration actuelle est correcte ?

Dans Search Console, section Sitemaps, vérifiez que tous les sitemaps déclarés affichent un statut « Réussite » avec un nombre d'URLs découvertes cohérent. Un sitemap qui liste 5000 URLs mais n'en remonte que 200 signale probablement un problème de portée.

Utilisez un crawler comme Screaming Frog ou OnCrawl pour croiser les URLs présentes dans vos sitemaps avec celles effectivement indexées. Un écart significatif entre URLs soumises et URLs indexées peut indiquer une limitation de portée non détectée, surtout si les URLs manquantes sont hors du répertoire du sitemap.

Quelles erreurs éviter absolument ?

Ne déployez jamais un sitemap dans un sous-répertoire sans validation explicite dans GSC ou robots.txt. Cette configuration silencieuse échoue sans générer d'alerte visible, créant des trous d'indexation difficiles à diagnostiquer. Google ne vous préviendra pas que 60% de votre sitemap est ignoré.

Évitez aussi de multiplier les sitemaps redondants dans différents répertoires. Un même ensemble d'URLs déclaré dans /sitemap.xml et /blog/sitemap.xml crée de la confusion pour le crawl budget et dilue les signaux de priorité. Chaque URL doit apparaître dans un seul sitemap canonique.

  • Placer le sitemap principal à la racine du domaine (example.com/sitemap.xml)
  • Déclarer explicitement chaque sitemap dans Google Search Console
  • Vérifier que le fichier robots.txt référence correctement les sitemaps utilisés
  • Auditer régulièrement la cohérence entre URLs soumises et URLs indexées
  • Éviter les sitemaps orphelins dans des sous-répertoires sans déclaration GSC
  • Documenter l'architecture des sitemaps pour faciliter la maintenance par les équipes
La configuration des sitemaps peut sembler simple en surface, mais une architecture mal pensée génère des problèmes d'indexation difficiles à détecter. Pour les sites complexes avec multiples sections, une gouvernance rigoureuse des sitemaps devient critique. Si vous gérez un site d'envergure ou une architecture distribuée, l'accompagnement d'une agence SEO spécialisée permet d'éviter les pièges techniques et de structurer une stratégie de sitemaps robuste et évolutive.

❓ Questions frequentes

Un sitemap dans /blog/ peut-il référencer des URLs de /shop/ ?
Non, pas par défaut. Sans déclaration dans Search Console ou robots.txt, le sitemap est limité aux URLs du répertoire /blog/. Une configuration explicite dans GSC lève cette restriction.
Faut-il redéclarer un sitemap dans GSC après chaque modification ?
Non. Une fois déclaré, Google crawle régulièrement le fichier pour détecter les changements. Seul un changement d'URL du sitemap nécessite une nouvelle déclaration.
La mention dans robots.txt suffit-elle ou faut-il aussi déclarer dans GSC ?
Les deux méthodes fonctionnent indépendamment. La déclaration robots.txt élargit la portée par défaut, tandis que GSC offre un suivi détaillé. Combiner les deux est recommandé pour la redondance.
Cette règle s'applique-t-elle aussi aux sous-domaines ?
Non. Un sous-domaine (blog.example.com) est traité comme un domaine distinct. Un sitemap sur blog.example.com peut couvrir toutes les URLs de ce sous-domaine sans restriction de répertoire.
Que se passe-t-il si un sitemap liste des URLs hors de sa portée ?
Google ignore silencieusement les URLs hors périmètre. Le sitemap n'est pas rejeté globalement, mais les URLs non autorisées ne bénéficient pas de la soumission. Aucune alerte n'est générée dans GSC.
🏷 Sujets associes
Crawl & Indexation IA & SEO JavaScript & Technique Nom de domaine PDF & Fichiers Search Console

🎥 De la même vidéo 14

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1h01 · publiée le 20/09/2016

🎥 Voir la vidéo complète sur YouTube →

Declarations similaires

💬 Commentaires (0)

Soyez le premier à commenter.

2000 caractères restants
🔔

Recevez une analyse complète en temps réel des dernières déclarations de Google

Soyez alerté à chaque nouvelle déclaration officielle Google SEO — avec l'analyse complète incluse.

Aucun spam. Désinscription en 1 clic.