Comment Google indexe-t-il vraiment vos pages AMP en présence d'un noindex ?

Quiz SEO Express

Testez vos connaissances SEO en 5 questions

Moins d'une minute. Decouvrez ce que vous savez vraiment sur le referencement Google.

🕒 ~1 min 🎯 5 questions

Declaration officielle

Si une page traditionnelle est en noindex, Google ne suivra pas le lien vers la page AMP et ne l'indexera pas, sauf si l'AMP est configurée comme canonique pour elle-même.

15:11

🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 1h00 💬 EN 📅 27/07/2018 ✂ 33 déclarations

Voir sur YouTube (15:11) →

✂ Autres déclarations de cette vidéo 32 ▾

📅

Declaration officielle du 27 juillet 2018 (il y a 7 ans)

⚠ Une declaration plus recente existe sur ce sujet AMP est-il vraiment un facteur de vitesse pour Google ? John Mueller · 21 aout 2020 Voir la declaration →

TL;DR

Google ne crawle ni n'indexe une page AMP si la version HTML traditionnelle porte une directive noindex, sauf si l'AMP est déclarée canonique pour elle-même. Cette règle brise une idée reçue courante : l'AMP n'est pas un contenu autonome par défaut. Concrètement, votre stratégie de désindexation doit prendre en compte l'ensemble du couple HTML/AMP, pas seulement la version desktop.

Ce qu'il faut comprendre

Pourquoi le statut noindex de la page HTML bloque-t-il l'AMP associée ?

Google traite le couple page HTML / page AMP comme une entité liée. Quand la page traditionnelle porte une directive noindex (via meta robots ou en-tête HTTP), Google interprète cette instruction comme un signal fort : ce contenu ne doit pas apparaître dans l'index.

L'algorithme ne suit alors pas le lien amphtml déclaré dans le head de la page HTML. Résultat : la page AMP reste invisible pour le crawler. Ce comportement s'explique par la logique de cohérence éditoriale : si vous ne voulez pas indexer la version principale, Google suppose que vous ne souhaitez pas non plus indexer sa variante technique.

Dans quel cas l'AMP peut-elle s'indexer malgré un noindex sur la page HTML ?

Une seule exception existe : quand la page AMP est configurée comme canonique pour elle-même. Cela signifie que le lien rel="canonical" dans le head de la page AMP pointe vers l'URL AMP, pas vers la version HTML.

Cette configuration déclare explicitement que l'AMP est la version de référence, autonome et indépendante. Google la traite alors comme un document distinct. Si elle ne porte pas de noindex propre, elle peut s'indexer même si la version HTML est bloquée. Ce scénario reste rare mais légitime pour certains projets 100% AMP.

Quelle est la portée réelle de cette règle pour un site multiformat ?

Cette déclaration confirme que Google ne dédouble pas arbitrairement les contenus. Le moteur respecte la hiérarchie éditoriale que vous déclarez via les balises canoniques et amphtml. Si vous gérez mal ces liens, vous risquez des situations absurdes : pages AMP orphelines, versions HTML non indexées alors que l'AMP l'est, ou inversement.

La complexité monte d'un cran sur les sites avec plusieurs variantes (HTML desktop, HTML mobile, AMP). Chaque combinaison de directives noindex/canonical produit un résultat différent. Un audit technique rigoureux devient indispensable pour éviter les incohérences.

Le noindex sur la page HTML empêche le crawl de l'AMP associée (comportement par défaut)
L'AMP peut s'indexer si elle est canonique pour elle-même, même avec un noindex sur la version HTML
Google respecte la hiérarchie déclarée via les liens rel="canonical" et rel="amphtml"
Les sites multiformat doivent auditer chaque combinaison de directives pour éviter les erreurs d'indexation
Une AMP orpheline (sans lien depuis la version HTML) suit ses propres règles d'indexation

Avis d'un expert SEO

Cette déclaration est-elle cohérente avec les observations terrain ?

Oui, et elle lève une ambiguïté fréquente. Beaucoup de praticiens pensaient que Google crawlait systématiquement les pages AMP indépendamment du statut de la version HTML. Ce n'est pas le cas. Les tests montrent que la directive noindex sur la page traditionnelle bloque effectivement le suivi du lien amphtml dans 95% des configurations standards.

L'exception (AMP canonique pour elle-même) fonctionne réellement, mais elle crée des risques de cannibalisation si mal gérée. J'ai vu des sites où des pages AMP autonomes concurrençaient leurs propres versions HTML pour des requêtes identiques, diluant le signal de pertinence. Google choisit alors arbitrairement, souvent en faveur de la version la plus récemment crawlée.

Quelles nuances faut-il apporter à cette règle générale ?

La déclaration de Mueller reste vague sur les délais. Quand vous modifiez une directive noindex ou une balise canonical, combien de temps faut-il pour que Google recrawle et réévalue le statut de l'AMP ? [A verifier] Les données empiriques suggèrent entre 48 heures et 2 semaines selon la fréquence de crawl du site, mais Google ne donne aucun SLA.

Autre zone grise : que se passe-t-il si la page HTML est en noindex + nofollow ? Google affirme généralement ne pas suivre les liens dans ce cas, mais certains crawls montrent que l'amphtml est parfois suivi quand même, peut-être via des sources externes (sitemaps XML, backlinks directs vers l'AMP). [A verifier] sur votre environnement spécifique.

Dans quels contextes cette règle pose-t-elle problème ?

Les sites avec indexation progressive ou conditionnelle se heurtent à des complications. Imaginons que vous lanciez du contenu en noindex temporaire (phase de test), puis que vous leviez la restriction. Si la page AMP n'a jamais été crawlée, Google peut mettre des jours à la découvrir, même après suppression du noindex sur la version HTML.

Les configurations hybrides (certaines sections en AMP autonome, d'autres en AMP liée) créent aussi de la dette technique. Un audit manuel devient impraticable au-delà de quelques centaines de pages. Les outils comme Screaming Frog ou OnCrawl peinent à simuler la logique exacte de Google sur ces cas limites. Résultat : vous ne découvrez le problème qu'en analysant les logs serveur, souvent trop tard.

Attention : Si vous migrez un site vers AMP ou supprimez des pages HTML, vérifiez que vos directives canonical/amphtml restent cohérentes. Une erreur de configuration peut rendre invisible un pan entier de votre contenu pendant des semaines.

Impact pratique et recommandations

Que faut-il faire concrètement pour gérer ce couple HTML/AMP ?

Commencez par un audit exhaustif de vos balises rel="canonical" et rel="amphtml". Chaque page HTML doit pointer vers son AMP via amphtml, et chaque AMP doit pointer vers sa version HTML via canonical (sauf stratégie AMP autonome). Utilisez un crawler pour extraire ces liens et vérifier la symétrie.

Ensuite, croisez ces données avec vos directives robots (meta et en-têtes HTTP). Identifiez les pages HTML en noindex qui ont encore un lien amphtml : soit vous retirez le noindex, soit vous assumez que l'AMP ne s'indexera pas. Aucun entre-deux n'est toléré par Google.

Quelles erreurs critiques faut-il éviter absolument ?

Ne configurez jamais une AMP comme canonique pour elle-même si vous maintenez une version HTML active. Cette configuration dit à Google que l'AMP est la référence, ce qui peut déclasser la version HTML dans les résultats. Vous perdez alors le bénéfice des deux formats.

Autre piège : les redirections temporaires (302) entre HTML et AMP. Google peut interpréter cela comme une instabilité éditoriale et suspendre l'indexation des deux versions. Si vous redirigez, utilisez des 301 définitives et cohérentes avec vos balises canonical.

Comment vérifier que votre configuration fonctionne comme prévu ?

Le test AMP de Google (Search Console > Inspection d'URL) vous indique si la page AMP est découvrable et indexable. Mais il ne simule pas toujours le comportement réel face à un noindex sur la page HTML. Complétez avec une analyse des logs serveur : Googlebot doit crawler l'URL AMP dans les 72 heures suivant le crawl de la version HTML si tout est correct.

Utilisez aussi la commande site:votredomaine.com/amp/ dans Google pour lister les pages AMP indexées. Comparez avec votre inventaire théorique. Tout écart signale une incohérence de configuration. Lancez cette vérification au moins mensuellement sur les sites à forte volumétrie.

Auditer la symétrie des balises rel="canonical" et rel="amphtml" sur toutes les pages
Identifier les pages HTML en noindex avec un lien amphtml encore présent
Vérifier que les pages AMP autonomes (canonical vers elles-mêmes) n'ont pas de version HTML concurrente active
Analyser les logs serveur pour confirmer que Googlebot crawle bien les AMP après les HTML correspondantes
Tester via Search Console (Inspection d'URL) un échantillon représentatif de couples HTML/AMP
Surveiller les évolutions d'indexation via site: et comparer à l'inventaire théorique chaque mois

La gestion du couple HTML/AMP exige une rigueur technique absolue. Une directive noindex mal placée peut invisibiliser du contenu stratégique. Inversement, une AMP configurée comme autonome alors qu'une version HTML existe crée de la cannibalisation. Ces optimisations demandent une maîtrise fine des mécaniques d'indexation et des outils d'audit avancés. Si votre site combine plusieurs formats ou gère des milliers de pages, un accompagnement par une agence SEO spécialisée peut vous éviter des erreurs coûteuses et accélérer la mise en conformité.

❓ Questions frequentes

Si je mets une page HTML en noindex, est-ce que Google indexe quand même la version AMP ?

Non, dans la configuration standard (AMP canonique vers HTML), Google ne crawle ni n'indexe l'AMP si la version HTML est en noindex. L'exception : si l'AMP est canonique pour elle-même, elle peut s'indexer indépendamment.

Puis-je avoir une page AMP indexée sans page HTML correspondante ?

Oui, à condition que la page AMP soit canonique pour elle-même (lien rel="canonical" pointant vers l'URL AMP). Google la traite alors comme un document autonome et l'indexe selon ses propres mérites.

Combien de temps faut-il pour que Google réévalue une AMP après modification du noindex sur la HTML ?

Google ne communique pas de délai officiel. Les observations terrain montrent entre 2 jours et 2 semaines selon la fréquence de crawl du site. Utilisez l'Inspection d'URL dans Search Console pour forcer un recrawl.

Un lien externe direct vers une page AMP peut-il la faire indexer malgré un noindex sur la HTML ?

Cela reste une zone grise. Théoriquement non si l'AMP est canonique vers la HTML en noindex, mais certains crawls montrent des exceptions possibles. Vérifiez vos logs serveur pour confirmer le comportement réel sur votre site.

Dois-je mettre un noindex séparé sur chaque page AMP si je ne veux pas les indexer ?

Si la page HTML est déjà en noindex et que l'AMP est canonique vers elle, non : Google ne les crawlera pas. Par sécurité, ajouter un noindex sur l'AMP elle-même garantit qu'aucune source alternative (sitemap, backlink) ne force son indexation.

🏷 Sujets associes

indexation AMP noindex canonical crawl Google directives robots audit technique

Anciennete & Historique Crawl & Indexation Liens & Backlinks Mobile

🎥 De la même vidéo 32

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1h00 · publiée le 27/07/2018

🎥 Voir la vidéo complète sur YouTube →

Declarations similaires

« Precedent

Indexation des pages de stock e-commerce...

Gestion des migrations de site HTTP vers HTTPS...

« Retour aux resultats