Pourquoi Google réserve-t-il le rapport Crawl Stats aux propriétés de domaine uniquement ?

Declaration officielle

Le rapport Statistiques d'exploration dans Search Console est uniquement disponible pour les propriétés au niveau du domaine. Il n'est pas disponible pour les propriétés qui incluent un préfixe d'URL.

61:43

🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 161h29 💬 EN 📅 03/03/2021 ✂ 14 déclarations

Voir sur YouTube (61:43) →

✂ Autres déclarations de cette vidéo 13 ▾

9:53 Le budget de crawl est-il vraiment inutile pour les petits sites ?
15:14 Comment Google décide-t-il quelles pages crawler en priorité sur votre site ?
25:55 Qu'est-ce que la demande de crawl et comment Google la calcule-t-il vraiment ?
33:45 Comment Google calcule-t-il le taux de crawl pour ne pas planter vos serveurs ?
37:38 Le crawl budget augmente-t-il vraiment avec la vitesse de votre serveur ?
41:11 Pourquoi un site lent tue-t-il votre taux de crawl Google ?
43:17 Peut-on vraiment limiter le taux de crawl de Google sans risquer son référencement ?
46:04 Le budget de crawl, simple combinaison de taux et de demande ?
69:24 Les ressources externes faussent-elles vos statistiques de crawl ?
77:09 Le temps de réponse exclut-il vraiment le rendu de page dans Search Console ?
82:21 Pourquoi une chute brutale des requêtes de crawl peut-elle révéler un problème de robots.txt ou de temps de réponse ?
87:00 Le temps de réponse serveur influence-t-il vraiment le taux de crawl de Googlebot ?
101:16 Pourquoi un code 503 sur robots.txt peut-il bloquer tout le crawl de votre site ?

Ce qu'il faut comprendre

Quelle est la différence entre propriété de domaine et propriété de préfixe d'URL ?

Dans Search Console, Google propose deux types de configuration : la propriété de domaine et la propriété de préfixe d'URL. La première agrège toutes les variantes d'un domaine (http, https, www, sous-domaines) en une seule vue consolidée. Elle nécessite une validation DNS, ce qui prouve que vous contrôlez bien l'ensemble du domaine.

La propriété de préfixe d'URL, elle, cible une URL précise : https://www.exemple.com ou https://exemple.com/blog/. Plus simple à configurer (balise HTML, Google Analytics, Tag Manager), elle reste limitée au périmètre déclaré. Si vous avez plusieurs sous-domaines ou versions du site, chaque préfixe devient une propriété distincte.

Pourquoi cette restriction sur le rapport Crawl Stats ?

Le rapport Statistiques d'exploration analyse le comportement de Googlebot : nombre de requêtes par jour, volume de données téléchargées, temps de réponse moyen, codes HTTP retournés. Ces métriques n'ont de sens qu'à l'échelle du domaine complet — un sous-domaine isolé ou un dossier spécifique ne reflète qu'une fraction du crawl.

Google a visiblement décidé que fragmenter ces données par préfixe créerait plus de confusion que de valeur. La propriété de domaine impose aussi une validation DNS, garantissant que seul le propriétaire légitime accède à des informations stratégiques sur l'infrastructure du site. C'est un filtre de sécurité et de cohérence.

Quelles données perd-on sans accès au rapport Crawl Stats ?

Sans ce rapport, vous naviguez à l'aveugle sur plusieurs dimensions critiques. Impossible de détecter un pic anormal de crawl qui saturerait vos ressources serveur. Impossible de corréler une baisse de performances avec une hausse soudaine de requêtes bot. Impossible de vérifier si Googlebot rencontre des erreurs serveur récurrentes ou des temps de réponse dégradés.

Vous perdez aussi la visibilité sur l'évolution du crawl budget — combien de pages Google explore chaque jour, quelles sections privilégie-t-il, où passe-t-il du temps inutilement. Pour un gros site e-commerce ou un média avec des milliers de pages, cette cécité devient handicapante. Les logs serveur restent une alternative, mais leur exploitation demande du temps et des compétences techniques.

Le rapport Crawl Stats n'est jamais accessible via une propriété de préfixe d'URL, quelle que soit la méthode de validation utilisée
La propriété de domaine requiert une validation DNS (enregistrement TXT), ce qui centralise tous les sous-domaines et protocoles
Les données de crawl incluent : requêtes par jour, temps de réponse, volume de Ko téléchargés, répartition des codes HTTP, type de fichiers crawlés
Pour un site avec plusieurs variantes (http/https, www/non-www, sous-domaines), seule la propriété de domaine offre une vue consolidée du comportement de Googlebot
Cette restriction pousse les SEO à adopter une architecture de validation plus rigoureuse dans Search Console

Avis d'un expert SEO

Cette restriction est-elle vraiment justifiée techniquement ?

Soyons honnêtes : Google aurait parfaitement pu proposer des stats de crawl limitées au périmètre d'un préfixe. Techniquement, rien n'empêche d'isoler les requêtes Googlebot sur https://exemple.com/blog/ et d'afficher des métriques spécifiques. Mais la cohérence des données devient vite douteuse — un bot ne respecte pas toujours les frontières de dossier, il suit des liens internes, explore le domaine dans sa globalité.

La vraie raison tient sans doute à la simplification de l'interface et à la sécurité. En réservant ces métriques aux propriétaires validés DNS, Google évite de fragmenter des indicateurs qui perdent leur sens hors contexte. C'est aussi un levier pour pousser les SEO vers une configuration de domaine complète — plus propre, plus fiable, moins sujette aux erreurs de périmètre.

Quels contournements existent pour analyser le crawl sans propriété de domaine ?

Les logs serveur restent la solution de référence. Apache, Nginx, IIS — tous journalisent chaque requête avec IP, user-agent, URL, code HTTP, temps de réponse. Des outils comme Oncrawl, Botify, SEOlyzer ou des scripts Python maison extraient et agrègent ces données. Vous obtenez alors une vision granulaire du crawl, bien plus détaillée que Search Console.

Mais cette approche demande un accès aux logs (pas toujours évident en hébergement mutualisé), une infrastructure de traitement (les fichiers pèsent vite plusieurs Go par jour sur un gros site), et des compétences pour interpréter les résultats. [À vérifier] : certains affirment que les outils tiers capturent mieux les crawls multi-bots (Googlebot Desktop, Mobile, Images, News) que Search Console, mais Google n'a jamais confirmé de différence de granularité.

Dans quels cas cette limitation pose-t-elle un vrai problème ?

Pour un site monolithique sur un domaine unique, configurer une propriété de domaine reste trivial. Le SEO ajuste un enregistrement DNS, attend la validation, et accède au rapport. Aucun drame. Mais sur des architectures complexes — multimarques, sous-domaines gérés par des équipes différentes, sites en marque blanche — la validation DNS devient un parcours bureaucratique.

Certaines organisations imposent des processus IT lourds pour toucher au DNS. Le SEO n'a pas toujours les droits, doit passer par des tickets internes, attendre des jours. Pendant ce temps, un problème de crawl peut saccager le référencement. Et c'est là que ça coince : Google impose un prérequis technique qui, dans certaines structures, bloque l'accès à des données critiques.

Si vous gérez un site avec plusieurs sous-domaines indépendants (blog.exemple.com, shop.exemple.com, support.exemple.com) et que vous n'avez pas d'accès DNS centralisé, vous ne pourrez jamais consolider les stats de crawl dans Search Console. Les logs serveur deviennent alors la seule alternative fiable.

Impact pratique et recommandations

Comment configurer une propriété de domaine pour accéder au rapport Crawl Stats ?

Rendez-vous dans Search Console, cliquez sur le sélecteur de propriétés en haut à gauche, puis « Ajouter une propriété ». Choisissez « Domaine » (pas « Préfixe d'URL »). Saisissez votre domaine sans protocole ni www : exemple.com. Google génère alors un enregistrement DNS TXT à copier dans la configuration de votre hébergeur ou registrar.

Connectez-vous à votre interface DNS (OVH, Cloudflare, AWS Route 53, Gandi…), créez un enregistrement TXT sur la racine du domaine (@) avec la valeur fournie. Patience : la propagation DNS peut prendre quelques minutes à plusieurs heures. Revenez dans Search Console, cliquez sur « Vérifier ». Si tout est correct, la propriété se valide instantanément et agrège toutes les variantes du domaine.

Quelles erreurs éviter lors de la configuration ?

Première boulette classique : ajouter l'enregistrement TXT sur un sous-domaine plutôt que sur la racine. Si vous validez blog.exemple.com au lieu d'exemple.com, seul le sous-domaine sera couvert. Le rapport Crawl Stats restera vide ou incomplet. Vérifiez toujours que l'enregistrement cible bien @ ou la racine, pas www ou autre préfixe.

Autre piège : certains hébergeurs écrasent automatiquement les enregistrements TXT existants. Si vous avez déjà un TXT pour SPF, DKIM ou autre, assurez-vous que votre interface permet plusieurs valeurs TXT sur le même domaine. Sinon, vous risquez de casser vos emails en supprimant l'ancien enregistrement. La plupart des DNS modernes supportent plusieurs TXT — mais confirmez avant.

Que faire si l'accès DNS est bloqué dans votre organisation ?

Négociez avec l'équipe IT en expliquant l'impact SEO : sans visibilité sur le crawl, impossible d'optimiser le budget de crawl, de détecter les surcharges serveur, de corriger les erreurs 5xx récurrentes. Préparez un argumentaire chiffré : combien de pages stratégiques ne sont pas crawlées, quel manque à gagner en trafic organique.

Si le DNS reste verrouillé, basculez sur l'analyse de logs serveur. Demandez un accès SFTP ou SSH aux fichiers de logs (access.log, error.log), ou configurez une rotation automatique vers un bucket S3 que vous analyserez avec un outil tiers. C'est plus lourd, mais souvent plus granulaire que Search Console — vous verrez chaque requête bot en temps réel, pas un agrégat quotidien.

Accédez à l'interface DNS de votre domaine et créez un enregistrement TXT sur la racine (@) avec la valeur fournie par Google
Vérifiez que l'enregistrement est bien propagé (outil : mxtoolbox.com/TXTLookup.aspx) avant de cliquer sur « Vérifier » dans Search Console
Confirmez que la propriété de domaine agrège bien toutes les variantes (http, https, www, non-www, sous-domaines) dans l'onglet « Paramètres » de Search Console
Si vous gérez plusieurs marques ou sous-domaines indépendants, envisagez une propriété de domaine par marque pour segmenter les rapports de crawl
Documentez la procédure de validation DNS dans un wiki interne pour éviter que chaque changement d'équipe ne réinitialise la configuration
Mettez en place une alerte (Google Analytics, Tag Manager, outil de monitoring) si la propriété perd sa validation — cela peut arriver en cas de migration DNS mal gérée

L'accès au rapport Crawl Stats exige une propriété de domaine validée par DNS. Si cette validation pose problème dans votre structure, les logs serveur offrent une alternative plus technique mais souvent plus riche. Pour les sites complexes ou les migrations sensibles, ces optimisations de configuration peuvent rapidement devenir chronophages et nécessiter une expertise approfondie. Dans ce contexte, faire appel à une agence SEO spécialisée permet de sécuriser la configuration Search Console, d'analyser finement le comportement de Googlebot, et de piloter le crawl budget sans mobiliser vos ressources IT en continu.

❓ Questions frequentes

Peut-on avoir à la fois une propriété de domaine et une propriété de préfixe d'URL sur le même site ?

Oui, c'est même recommandé. La propriété de domaine donne accès aux stats de crawl globales, tandis que les propriétés de préfixe permettent de segmenter les rapports de performances par section (blog, e-commerce, etc.). Les deux coexistent sans conflit.

Le rapport Crawl Stats est-il en temps réel ou avec délai ?

Les données sont agrégées avec un délai de 24 à 48 heures. Vous ne verrez jamais le crawl de la journée en cours. Pour du monitoring temps réel, les logs serveur restent indispensables.

Si je valide une propriété de domaine, les anciennes propriétés de préfixe perdent-elles leurs données historiques ?

Non, chaque propriété conserve ses données indépendamment. Vous pouvez garder les préfixes existants pour l'historique et ajouter une propriété de domaine sans perte d'informations.

La validation DNS de la propriété de domaine peut-elle casser la configuration SPF ou DKIM de mes emails ?

Uniquement si votre interface DNS ne supporte qu'un seul enregistrement TXT par domaine, ce qui est rare. La plupart des hébergeurs modernes permettent plusieurs TXT sur la même racine. Vérifiez avant de modifier quoi que ce soit.

Quelles métriques du rapport Crawl Stats sont réellement actionnables pour un SEO ?

Le nombre de requêtes par jour (pour détecter les pics anormaux), le temps de réponse moyen (pour identifier les ralentissements serveur), et la répartition des codes HTTP (pour repérer les erreurs 5xx ou redirections excessives). Le reste reste surtout informatif.

🎥 De la même vidéo 13

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 161h29 · publiée le 03/03/2021

🎥 Voir la vidéo complète sur YouTube →