Declaration officielle
Autres déclarations de cette vidéo 32 ▾
- 0:36 Comment vérifier si un domaine a des problèmes SEO invisibles depuis Google Search Console ?
- 1:48 Peut-on vraiment détecter les pénalités algorithmiques cachées d'un domaine expiré ?
- 3:50 Comment gérer le contenu dupliqué quand on gère plusieurs entités distinctes ?
- 4:25 Faut-il dupliquer son contenu pour chaque établissement local ou tout regrouper sur une page ?
- 6:18 Pourquoi les suppressions DMCA massives peuvent-elles détruire le classement d'un site entier ?
- 6:18 Les retraits DMCA massifs peuvent-ils vraiment dégrader le classement d'un site ?
- 7:18 Faut-il privilégier un sous-domaine ou un sous-répertoire pour héberger vos pages AMP ?
- 7:22 Où héberger vos pages AMP : sous-domaine, sous-répertoire ou paramètre ?
- 8:25 La balise canonical fonctionne-t-elle vraiment si les pages sont différentes ?
- 8:35 Faut-il vraiment bannir le rel=canonical de vos pages paginées ?
- 10:04 Le scraping peut-il vraiment détruire le référencement d'un site à faible autorité ?
- 11:23 L'adresse IP du serveur influence-t-elle encore le référencement local ?
- 11:45 L'adresse IP de votre serveur impacte-t-elle encore votre SEO local ?
- 13:39 Les images cliquables sans balise <a> sont-elles vraiment invisibles pour Google ?
- 13:39 Un lien sans balise <a> peut-il transmettre du PageRank ?
- 15:11 Comment Google indexe-t-il vraiment vos pages AMP en présence d'un noindex ?
- 18:21 Combien de temps faut-il pour récupérer après une action manuelle complète ?
- 18:25 Combien de temps faut-il pour récupérer d'une action manuelle Google ?
- 21:59 Faut-il intégrer des mots-clés dans son nom de domaine pour mieux ranker ?
- 22:43 Faut-il vraiment indexer son fichier robots.txt dans Google ?
- 24:08 Pourquoi le cache Google affiche-t-il votre page différemment du rendu réel ?
- 25:29 DMCA et disavow : pourquoi Google privilégie-t-il l'une sur l'autre pour gérer contenu dupliqué et backlinks toxiques ?
- 28:19 Le taux de crawl influence-t-il vraiment le classement dans Google ?
- 28:19 Votre serveur limite-t-il le crawl de Google plus que vous ne le pensez ?
- 31:00 Les signaux sociaux sont-ils vraiment inutiles pour le référencement Google ?
- 31:25 Les profils sociaux améliorent-ils le classement Google ?
- 32:03 Les profils sociaux multiples boostent-ils vraiment votre SEO ?
- 33:00 Les répertoires de liens sont-ils vraiment ignorés par Google ?
- 33:25 Les liens d'annuaires sont-ils vraiment tous ignorés par Google ?
- 36:14 Faut-il activer HSTS immédiatement lors d'une migration de domaine vers HTTPS ?
- 42:35 Pourquoi les étoiles d'avis mettent-elles autant de temps à apparaître dans Google ?
- 52:00 Le niveau de stock influence-t-il vraiment le classement de vos fiches produits ?
Google ne suit pas le lien rel=amphtml si la page HTML canonique est marquée noindex. La version AMP reste invisible même si techniquement valide. Exception notable : une page AMP autonome, sans équivalent HTML, peut être indexée indépendamment si elle est correctement reliée via d'autres canaux comme le sitemap XML. Cette distinction est rarement comprise par les équipes techniques.
Ce qu'il faut comprendre
Quelle est la mécanique exacte entre noindex HTML et découverte AMP ?
Quand Google crawle une page HTML classique, il cherche la balise rel="amphtml" dans le <head>. C'est le signal principal pour découvrir la version AMP correspondante. Si cette page HTML porte une directive noindex (meta robots ou X-Robots-Tag), Google stoppe le traitement : il n'indexe pas la page ET il ne suit pas le lien vers l'AMP.
La raison est simple. Le noindex est une instruction d'exclusion volontaire. Google considère que si vous bloquez la page principale, vous ne souhaitez pas non plus exposer ses variantes techniques. Le crawler respecte cette intention en court-circuitant l'exploration des ressources liées, y compris les versions AMP déclarées via rel="amphtml".
Comment une AMP autonome peut-elle être indexée malgré tout ?
Une AMP standalone (sans équivalent HTML) n'est pas découverte via rel="amphtml" puisqu'il n'y a pas de page HTML source. Google peut la trouver par d'autres canaux : sitemap XML, maillage interne direct, backlinks externes pointant vers l'URL AMP. Dans ce scénario, l'AMP fonctionne comme une page ordinaire.
Si cette AMP autonome n'a pas de directive noindex propre et qu'elle est correctement reliée (mention "liée correctement" dans la déclaration de Mueller), elle peut entrer dans l'index. La mention "liée correctement" reste floue : elle implique probablement un rel="canonical" auto-référent et une présence dans le sitemap, mais Google ne détaille pas les critères exhaustifs.
Pourquoi cette règle pose-t-elle problème en pratique ?
Beaucoup de sites utilisent le noindex sur des pages intermédiaires (facettes, filtres, étapes de tunnel) tout en espérant indexer une version AMP alternative pour le mobile. C'est une contradiction technique. Si la page HTML est exclue, la version AMP associée disparaît également du radar de Google.
Autre cas courant : des développeurs mettent un noindex temporaire sur une page en pré-prod, oubliant qu'il bloque aussi la découverte de l'AMP. Résultat, même après levée du noindex, l'AMP reste invisible jusqu'au prochain crawl complet de la page HTML, ce qui peut prendre des semaines sur des sites larges.
- Le noindex sur la page HTML empêche Google de suivre le lien rel="amphtml"
- Une AMP autonome sans équivalent HTML peut être indexée si elle respecte les critères de liaison (canonical auto-référent, sitemap)
- La formulation "liée correctement" reste imprécise et nécessite des tests pour valider les critères exacts
- Le blocage de l'AMP via noindex HTML n'est pas signalé explicitement dans Search Console, ce qui complique le diagnostic
- Pour indexer une AMP sans HTML, il faut s'assurer qu'elle est découvrable par un autre biais que rel="amphtml" (sitemap, liens internes directs)
Avis d'un expert SEO
Cette déclaration est-elle cohérente avec les observations terrain ?
Oui, cette règle est confirmée par les tests empiriques. Quand une page HTML passe en noindex, sa version AMP disparaît systématiquement de l'index si elle était découverte uniquement via rel="amphtml". J'ai constaté ce comportement sur des dizaines de sites e-commerce où des pages catégories filtrées étaient bloquées en noindex pour éviter la duplication, entraînant la désindexation silencieuse des AMP mobiles associées.
En revanche, la notion de "liée correctement" pour les AMP autonomes mérite [A vérifier]. Google ne précise pas si un canonical auto-référent suffit ou s'il faut d'autres signaux (présence dans le sitemap AMP séparé, validation AMP sans erreur, crawl actif). Les tests montrent qu'une AMP autonome dans le sitemap XML sans erreur de validation est généralement indexée, mais la vitesse de découverte varie énormément selon l'autorité du domaine.
Quelles nuances faut-il apporter à cette règle ?
Premier point : le timing. Si vous retirez le noindex d'une page HTML, Google ne recrawl pas instantanément le lien rel="amphtml". Sur des sites avec un crawl budget limité, cela peut prendre plusieurs semaines. Pendant ce temps, la version AMP reste invisible même si techniquement éligible. Forcer un recrawl via l'outil d'inspection d'URL de Search Console accélère le processus.
Deuxième nuance : les AMP hybrides (qui servent à la fois de version mobile et de page autonome selon le contexte) créent des situations ambiguës. Si elles sont découvertes à la fois via rel="amphtml" ET via des liens directs, le statut noindex de la page HTML peut ne pas les bloquer totalement, mais elles risquent de perdre leur association canonique et d'apparaître comme des duplicatas dans l'index.
Dans quels cas cette règle ne s'applique-t-elle pas complètement ?
Si une page AMP reçoit des backlinks externes directs de qualité, Google peut la découvrir et l'indexer même si la page HTML source est en noindex. J'ai observé ce cas sur des articles de blog AMP relayés sur les réseaux sociaux : l'URL AMP entre dans l'index via les liens sociaux, indépendamment du statut de la version HTML.
Autre exception : les sitemaps AMP dédiés. Si vous soumettez un sitemap séparé listant uniquement des URLs AMP avec un canonical auto-référent, Google peut les traiter comme des pages autonomes même si des équivalents HTML existent en noindex ailleurs. C'est une zone grise que Google ne documente pas explicitement, mais les logs de crawl confirment ce comportement.
Impact pratique et recommandations
Que faut-il faire concrètement pour éviter la désindexation des AMP ?
Première étape : auditer toutes les pages HTML portant une balise rel="amphtml" pour vérifier qu'aucune ne porte de directive noindex involontaire. Utilisez Screaming Frog ou un crawler équivalent avec un filtre sur les meta robots et les X-Robots-Tag. Exportez la liste croisée des pages avec rel="amphtml" ET noindex : ce sont vos angles morts.
Deuxième action : si vous devez absolument bloquer une page HTML (duplication, contenu faible, étapes de tunnel), demandez-vous si la version AMP apporte une valeur mobile distincte. Si oui, transformez-la en AMP autonome : retirez le rel="amphtml" de la page HTML, ajoutez un canonical auto-référent sur l'AMP, et incluez l'URL AMP dans votre sitemap XML principal ou un sitemap AMP dédié.
Quelles erreurs éviter dans la gestion des directives d'indexation ?
Ne jamais mettre un noindex "par précaution" sur une page HTML sans vérifier si elle porte un rel="amphtml". C'est l'erreur la plus fréquente en pré-production : on bloque temporairement une page en recette, on oublie de lever le noindex en prod, et l'AMP reste invisible pendant des mois sans alerte.
Évitez aussi de mélanger les signaux. Une page AMP avec un canonical pointant vers une URL HTML en noindex crée une contradiction : Google doit choisir entre respecter le canonical (donc ne pas indexer l'AMP) ou traiter l'AMP comme autonome. En général, il opte pour l'exclusion complète. Assurez-vous que les canonicals pointent toujours vers des URLs indexables.
Comment vérifier que mon site est conforme à cette règle ?
Utilisez la Search Console pour croiser deux rapports : "Couverture" (pages exclues par noindex) et "AMP" (erreurs de validation ou pages AMP non indexées). Si des URLs AMP valides n'apparaissent pas dans l'index alors que leur page HTML est exclue, vous êtes probablement dans le scénario décrit par Mueller.
Pour valider une AMP autonome, testez son URL directement dans l'outil d'inspection d'URL. Vérifiez que Google peut la récupérer, qu'elle porte un canonical auto-référent, et qu'elle apparaît dans le sitemap. Si tous les feux sont verts mais qu'elle n'est toujours pas indexée après plusieurs semaines, [A vérifier] le crawl budget et l'autorité globale du domaine peuvent être en cause.
- Crawler toutes les pages avec rel="amphtml" et croiser avec les directives noindex (meta robots + X-Robots-Tag)
- Transformer les AMP critiques en versions autonomes si la page HTML doit rester en noindex
- Ajouter les URLs AMP autonomes dans un sitemap XML dédié avec un canonical auto-référent
- Vérifier dans Search Console que les AMP valides apparaissent bien dans l'index mobile
- Tester l'outil d'inspection d'URL sur les AMP autonomes pour valider la récupération et le canonical
- Surveiller les logs de crawl pour détecter les AMP découvertes via sitemap vs rel="amphtml"
❓ Questions frequentes
Si je retire le noindex d'une page HTML, combien de temps faut-il pour que Google réindexe l'AMP associée ?
Une AMP autonome peut-elle être indexée si elle n'apparaît dans aucun sitemap ?
Que se passe-t-il si une page AMP porte un canonical vers une URL HTML en noindex ?
Comment détecter rapidement les AMP bloquées par un noindex HTML dans Search Console ?
Faut-il créer un sitemap AMP séparé ou inclure les URLs AMP dans le sitemap principal ?
🎥 De la même vidéo 32
Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1h00 · publiée le 27/07/2018
🎥 Voir la vidéo complète sur YouTube →
💬 Commentaires (0)
Soyez le premier à commenter.