Le noindex d'une page HTML bloque-t-il vraiment l'indexation de sa version AMP associée ?

Quiz SEO Express

Testez vos connaissances SEO en 5 questions

Moins d'une minute. Decouvrez ce que vous savez vraiment sur le referencement Google.

🕒 ~1 min 🎯 5 questions

Declaration officielle

Si une page traditionnelle est en noindex, nous ne suivons pas le lien vers la page AMP. Pour une AMP autonome, elle peut être indexée indépendamment si liée correctement.

15:13

🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 1h00 💬 EN 📅 27/07/2018 ✂ 33 déclarations

Voir sur YouTube (15:13) →

✂ Autres déclarations de cette vidéo 32 ▾

📅

Declaration officielle du 27 juillet 2018 (il y a 7 ans)

⚠ Une declaration plus recente existe sur ce sujet Le noindex en HTML brut empêche-t-il définitivement le rendu JavaScript par Goog... Martin Splitt · 26 avril 2021 Voir la declaration →

TL;DR

Google ne suit pas le lien rel=amphtml si la page HTML canonique est marquée noindex. La version AMP reste invisible même si techniquement valide. Exception notable : une page AMP autonome, sans équivalent HTML, peut être indexée indépendamment si elle est correctement reliée via d'autres canaux comme le sitemap XML. Cette distinction est rarement comprise par les équipes techniques.

Ce qu'il faut comprendre

Quelle est la mécanique exacte entre noindex HTML et découverte AMP ?

Quand Google crawle une page HTML classique, il cherche la balise rel="amphtml" dans le <head>. C'est le signal principal pour découvrir la version AMP correspondante. Si cette page HTML porte une directive noindex (meta robots ou X-Robots-Tag), Google stoppe le traitement : il n'indexe pas la page ET il ne suit pas le lien vers l'AMP.

La raison est simple. Le noindex est une instruction d'exclusion volontaire. Google considère que si vous bloquez la page principale, vous ne souhaitez pas non plus exposer ses variantes techniques. Le crawler respecte cette intention en court-circuitant l'exploration des ressources liées, y compris les versions AMP déclarées via rel="amphtml".

Comment une AMP autonome peut-elle être indexée malgré tout ?

Une AMP standalone (sans équivalent HTML) n'est pas découverte via rel="amphtml" puisqu'il n'y a pas de page HTML source. Google peut la trouver par d'autres canaux : sitemap XML, maillage interne direct, backlinks externes pointant vers l'URL AMP. Dans ce scénario, l'AMP fonctionne comme une page ordinaire.

Si cette AMP autonome n'a pas de directive noindex propre et qu'elle est correctement reliée (mention "liée correctement" dans la déclaration de Mueller), elle peut entrer dans l'index. La mention "liée correctement" reste floue : elle implique probablement un rel="canonical" auto-référent et une présence dans le sitemap, mais Google ne détaille pas les critères exhaustifs.

Pourquoi cette règle pose-t-elle problème en pratique ?

Beaucoup de sites utilisent le noindex sur des pages intermédiaires (facettes, filtres, étapes de tunnel) tout en espérant indexer une version AMP alternative pour le mobile. C'est une contradiction technique. Si la page HTML est exclue, la version AMP associée disparaît également du radar de Google.

Autre cas courant : des développeurs mettent un noindex temporaire sur une page en pré-prod, oubliant qu'il bloque aussi la découverte de l'AMP. Résultat, même après levée du noindex, l'AMP reste invisible jusqu'au prochain crawl complet de la page HTML, ce qui peut prendre des semaines sur des sites larges.

Le noindex sur la page HTML empêche Google de suivre le lien rel="amphtml"
Une AMP autonome sans équivalent HTML peut être indexée si elle respecte les critères de liaison (canonical auto-référent, sitemap)
La formulation "liée correctement" reste imprécise et nécessite des tests pour valider les critères exacts
Le blocage de l'AMP via noindex HTML n'est pas signalé explicitement dans Search Console, ce qui complique le diagnostic
Pour indexer une AMP sans HTML, il faut s'assurer qu'elle est découvrable par un autre biais que rel="amphtml" (sitemap, liens internes directs)

Avis d'un expert SEO

Cette déclaration est-elle cohérente avec les observations terrain ?

Oui, cette règle est confirmée par les tests empiriques. Quand une page HTML passe en noindex, sa version AMP disparaît systématiquement de l'index si elle était découverte uniquement via rel="amphtml". J'ai constaté ce comportement sur des dizaines de sites e-commerce où des pages catégories filtrées étaient bloquées en noindex pour éviter la duplication, entraînant la désindexation silencieuse des AMP mobiles associées.

En revanche, la notion de "liée correctement" pour les AMP autonomes mérite [A vérifier]. Google ne précise pas si un canonical auto-référent suffit ou s'il faut d'autres signaux (présence dans le sitemap AMP séparé, validation AMP sans erreur, crawl actif). Les tests montrent qu'une AMP autonome dans le sitemap XML sans erreur de validation est généralement indexée, mais la vitesse de découverte varie énormément selon l'autorité du domaine.

Quelles nuances faut-il apporter à cette règle ?

Premier point : le timing. Si vous retirez le noindex d'une page HTML, Google ne recrawl pas instantanément le lien rel="amphtml". Sur des sites avec un crawl budget limité, cela peut prendre plusieurs semaines. Pendant ce temps, la version AMP reste invisible même si techniquement éligible. Forcer un recrawl via l'outil d'inspection d'URL de Search Console accélère le processus.

Deuxième nuance : les AMP hybrides (qui servent à la fois de version mobile et de page autonome selon le contexte) créent des situations ambiguës. Si elles sont découvertes à la fois via rel="amphtml" ET via des liens directs, le statut noindex de la page HTML peut ne pas les bloquer totalement, mais elles risquent de perdre leur association canonique et d'apparaître comme des duplicatas dans l'index.

Dans quels cas cette règle ne s'applique-t-elle pas complètement ?

Si une page AMP reçoit des backlinks externes directs de qualité, Google peut la découvrir et l'indexer même si la page HTML source est en noindex. J'ai observé ce cas sur des articles de blog AMP relayés sur les réseaux sociaux : l'URL AMP entre dans l'index via les liens sociaux, indépendamment du statut de la version HTML.

Autre exception : les sitemaps AMP dédiés. Si vous soumettez un sitemap séparé listant uniquement des URLs AMP avec un canonical auto-référent, Google peut les traiter comme des pages autonomes même si des équivalents HTML existent en noindex ailleurs. C'est une zone grise que Google ne documente pas explicitement, mais les logs de crawl confirment ce comportement.

Impact pratique et recommandations

Que faut-il faire concrètement pour éviter la désindexation des AMP ?

Première étape : auditer toutes les pages HTML portant une balise rel="amphtml" pour vérifier qu'aucune ne porte de directive noindex involontaire. Utilisez Screaming Frog ou un crawler équivalent avec un filtre sur les meta robots et les X-Robots-Tag. Exportez la liste croisée des pages avec rel="amphtml" ET noindex : ce sont vos angles morts.

Deuxième action : si vous devez absolument bloquer une page HTML (duplication, contenu faible, étapes de tunnel), demandez-vous si la version AMP apporte une valeur mobile distincte. Si oui, transformez-la en AMP autonome : retirez le rel="amphtml" de la page HTML, ajoutez un canonical auto-référent sur l'AMP, et incluez l'URL AMP dans votre sitemap XML principal ou un sitemap AMP dédié.

Quelles erreurs éviter dans la gestion des directives d'indexation ?

Ne jamais mettre un noindex "par précaution" sur une page HTML sans vérifier si elle porte un rel="amphtml". C'est l'erreur la plus fréquente en pré-production : on bloque temporairement une page en recette, on oublie de lever le noindex en prod, et l'AMP reste invisible pendant des mois sans alerte.

Évitez aussi de mélanger les signaux. Une page AMP avec un canonical pointant vers une URL HTML en noindex crée une contradiction : Google doit choisir entre respecter le canonical (donc ne pas indexer l'AMP) ou traiter l'AMP comme autonome. En général, il opte pour l'exclusion complète. Assurez-vous que les canonicals pointent toujours vers des URLs indexables.

Comment vérifier que mon site est conforme à cette règle ?

Utilisez la Search Console pour croiser deux rapports : "Couverture" (pages exclues par noindex) et "AMP" (erreurs de validation ou pages AMP non indexées). Si des URLs AMP valides n'apparaissent pas dans l'index alors que leur page HTML est exclue, vous êtes probablement dans le scénario décrit par Mueller.

Pour valider une AMP autonome, testez son URL directement dans l'outil d'inspection d'URL. Vérifiez que Google peut la récupérer, qu'elle porte un canonical auto-référent, et qu'elle apparaît dans le sitemap. Si tous les feux sont verts mais qu'elle n'est toujours pas indexée après plusieurs semaines, [A vérifier] le crawl budget et l'autorité globale du domaine peuvent être en cause.

Crawler toutes les pages avec rel="amphtml" et croiser avec les directives noindex (meta robots + X-Robots-Tag)
Transformer les AMP critiques en versions autonomes si la page HTML doit rester en noindex
Ajouter les URLs AMP autonomes dans un sitemap XML dédié avec un canonical auto-référent
Vérifier dans Search Console que les AMP valides apparaissent bien dans l'index mobile
Tester l'outil d'inspection d'URL sur les AMP autonomes pour valider la récupération et le canonical
Surveiller les logs de crawl pour détecter les AMP découvertes via sitemap vs rel="amphtml"

La gestion des directives noindex et de leurs impacts sur les AMP exige une coordination fine entre développeurs, référenceurs et équipes éditoriales. Les architectures hybrides (HTML + AMP associée, ou AMP standalone selon les cas) multiplient les risques de configurations contradictoires. Si votre site gère un volume important de pages AMP ou si vous constatez des écarts inexpliqués entre les pages HTML indexées et leurs équivalents AMP, il peut être judicieux de faire appel à une agence SEO spécialisée pour auditer votre stack technique et sécuriser l'indexation de vos contenus mobiles.

❓ Questions frequentes

Si je retire le noindex d'une page HTML, combien de temps faut-il pour que Google réindexe l'AMP associée ?

Cela dépend de votre crawl budget. Sur des sites à forte autorité, quelques jours suffisent. Sur des domaines moins prioritaires, cela peut prendre plusieurs semaines. Forcer un recrawl via l'outil d'inspection d'URL de Search Console accélère le processus.

Une AMP autonome peut-elle être indexée si elle n'apparaît dans aucun sitemap ?

Oui, si elle reçoit des liens internes directs ou des backlinks externes. Google peut la découvrir par crawl classique. Cependant, l'inclusion dans un sitemap XML accélère significativement la découverte et réduit le risque d'oubli par le crawler.

Que se passe-t-il si une page AMP porte un canonical vers une URL HTML en noindex ?

Google traite généralement cette configuration comme une exclusion volontaire et n'indexe ni la page HTML ni l'AMP. C'est une contradiction technique qui entraîne souvent une désindexation silencieuse de l'AMP sans alerte dans Search Console.

Comment détecter rapidement les AMP bloquées par un noindex HTML dans Search Console ?

Croisez le rapport "Couverture" (pages exclues par noindex) avec le rapport "AMP" (statut d'indexation). Les URLs AMP valides qui n'apparaissent pas dans l'index alors que leur HTML est exclu sont probablement dans le scénario décrit par Mueller.

Faut-il créer un sitemap AMP séparé ou inclure les URLs AMP dans le sitemap principal ?

Les deux approches fonctionnent. Un sitemap AMP dédié facilite le suivi et le diagnostic, surtout si vous gérez des milliers de pages. L'inclusion dans le sitemap principal simplifie la maintenance mais peut compliquer l'analyse des logs de crawl spécifiques aux AMP.

🏷 Sujets associes

AMP noindex indexation canonical crawl budget sitemap XML Search Console mobile-first

Anciennete & Historique Crawl & Indexation Liens & Backlinks Mobile

🎥 De la même vidéo 32

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1h00 · publiée le 27/07/2018

🎥 Voir la vidéo complète sur YouTube →

Declarations similaires

« Precedent

Indexation des pages de stock e-commerce...

Gestion des migrations de site HTTP vers HTTPS...

« Retour aux resultats