Que dit Google sur le SEO ? /
Quiz SEO Express

Testez vos connaissances SEO en 5 questions

Moins d'une minute. Decouvrez ce que vous savez vraiment sur le referencement Google.

🕒 ~1 min 🎯 5 questions

Declaration officielle

Si une page traditionnelle est en noindex, nous ne suivons pas le lien vers la page AMP. Pour une AMP autonome, elle peut être indexée indépendamment si liée correctement.
15:13
🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 1h00 💬 EN 📅 27/07/2018 ✂ 33 déclarations
Voir sur YouTube (15:13) →
Autres déclarations de cette vidéo 32
  1. 0:36 Comment vérifier si un domaine a des problèmes SEO invisibles depuis Google Search Console ?
  2. 1:48 Peut-on vraiment détecter les pénalités algorithmiques cachées d'un domaine expiré ?
  3. 3:50 Comment gérer le contenu dupliqué quand on gère plusieurs entités distinctes ?
  4. 4:25 Faut-il dupliquer son contenu pour chaque établissement local ou tout regrouper sur une page ?
  5. 6:18 Pourquoi les suppressions DMCA massives peuvent-elles détruire le classement d'un site entier ?
  6. 6:18 Les retraits DMCA massifs peuvent-ils vraiment dégrader le classement d'un site ?
  7. 7:18 Faut-il privilégier un sous-domaine ou un sous-répertoire pour héberger vos pages AMP ?
  8. 7:22 Où héberger vos pages AMP : sous-domaine, sous-répertoire ou paramètre ?
  9. 8:25 La balise canonical fonctionne-t-elle vraiment si les pages sont différentes ?
  10. 8:35 Faut-il vraiment bannir le rel=canonical de vos pages paginées ?
  11. 10:04 Le scraping peut-il vraiment détruire le référencement d'un site à faible autorité ?
  12. 11:23 L'adresse IP du serveur influence-t-elle encore le référencement local ?
  13. 11:45 L'adresse IP de votre serveur impacte-t-elle encore votre SEO local ?
  14. 13:39 Les images cliquables sans balise <a> sont-elles vraiment invisibles pour Google ?
  15. 13:39 Un lien sans balise <a> peut-il transmettre du PageRank ?
  16. 15:11 Comment Google indexe-t-il vraiment vos pages AMP en présence d'un noindex ?
  17. 18:21 Combien de temps faut-il pour récupérer après une action manuelle complète ?
  18. 18:25 Combien de temps faut-il pour récupérer d'une action manuelle Google ?
  19. 21:59 Faut-il intégrer des mots-clés dans son nom de domaine pour mieux ranker ?
  20. 22:43 Faut-il vraiment indexer son fichier robots.txt dans Google ?
  21. 24:08 Pourquoi le cache Google affiche-t-il votre page différemment du rendu réel ?
  22. 25:29 DMCA et disavow : pourquoi Google privilégie-t-il l'une sur l'autre pour gérer contenu dupliqué et backlinks toxiques ?
  23. 28:19 Le taux de crawl influence-t-il vraiment le classement dans Google ?
  24. 28:19 Votre serveur limite-t-il le crawl de Google plus que vous ne le pensez ?
  25. 31:00 Les signaux sociaux sont-ils vraiment inutiles pour le référencement Google ?
  26. 31:25 Les profils sociaux améliorent-ils le classement Google ?
  27. 32:03 Les profils sociaux multiples boostent-ils vraiment votre SEO ?
  28. 33:00 Les répertoires de liens sont-ils vraiment ignorés par Google ?
  29. 33:25 Les liens d'annuaires sont-ils vraiment tous ignorés par Google ?
  30. 36:14 Faut-il activer HSTS immédiatement lors d'une migration de domaine vers HTTPS ?
  31. 42:35 Pourquoi les étoiles d'avis mettent-elles autant de temps à apparaître dans Google ?
  32. 52:00 Le niveau de stock influence-t-il vraiment le classement de vos fiches produits ?
📅
Declaration officielle du (il y a 7 ans)
TL;DR

Google ne suit pas le lien rel=amphtml si la page HTML canonique est marquée noindex. La version AMP reste invisible même si techniquement valide. Exception notable : une page AMP autonome, sans équivalent HTML, peut être indexée indépendamment si elle est correctement reliée via d'autres canaux comme le sitemap XML. Cette distinction est rarement comprise par les équipes techniques.

Ce qu'il faut comprendre

Quelle est la mécanique exacte entre noindex HTML et découverte AMP ?

Quand Google crawle une page HTML classique, il cherche la balise rel="amphtml" dans le <head>. C'est le signal principal pour découvrir la version AMP correspondante. Si cette page HTML porte une directive noindex (meta robots ou X-Robots-Tag), Google stoppe le traitement : il n'indexe pas la page ET il ne suit pas le lien vers l'AMP.

La raison est simple. Le noindex est une instruction d'exclusion volontaire. Google considère que si vous bloquez la page principale, vous ne souhaitez pas non plus exposer ses variantes techniques. Le crawler respecte cette intention en court-circuitant l'exploration des ressources liées, y compris les versions AMP déclarées via rel="amphtml".

Comment une AMP autonome peut-elle être indexée malgré tout ?

Une AMP standalone (sans équivalent HTML) n'est pas découverte via rel="amphtml" puisqu'il n'y a pas de page HTML source. Google peut la trouver par d'autres canaux : sitemap XML, maillage interne direct, backlinks externes pointant vers l'URL AMP. Dans ce scénario, l'AMP fonctionne comme une page ordinaire.

Si cette AMP autonome n'a pas de directive noindex propre et qu'elle est correctement reliée (mention "liée correctement" dans la déclaration de Mueller), elle peut entrer dans l'index. La mention "liée correctement" reste floue : elle implique probablement un rel="canonical" auto-référent et une présence dans le sitemap, mais Google ne détaille pas les critères exhaustifs.

Pourquoi cette règle pose-t-elle problème en pratique ?

Beaucoup de sites utilisent le noindex sur des pages intermédiaires (facettes, filtres, étapes de tunnel) tout en espérant indexer une version AMP alternative pour le mobile. C'est une contradiction technique. Si la page HTML est exclue, la version AMP associée disparaît également du radar de Google.

Autre cas courant : des développeurs mettent un noindex temporaire sur une page en pré-prod, oubliant qu'il bloque aussi la découverte de l'AMP. Résultat, même après levée du noindex, l'AMP reste invisible jusqu'au prochain crawl complet de la page HTML, ce qui peut prendre des semaines sur des sites larges.

  • Le noindex sur la page HTML empêche Google de suivre le lien rel="amphtml"
  • Une AMP autonome sans équivalent HTML peut être indexée si elle respecte les critères de liaison (canonical auto-référent, sitemap)
  • La formulation "liée correctement" reste imprécise et nécessite des tests pour valider les critères exacts
  • Le blocage de l'AMP via noindex HTML n'est pas signalé explicitement dans Search Console, ce qui complique le diagnostic
  • Pour indexer une AMP sans HTML, il faut s'assurer qu'elle est découvrable par un autre biais que rel="amphtml" (sitemap, liens internes directs)

Avis d'un expert SEO

Cette déclaration est-elle cohérente avec les observations terrain ?

Oui, cette règle est confirmée par les tests empiriques. Quand une page HTML passe en noindex, sa version AMP disparaît systématiquement de l'index si elle était découverte uniquement via rel="amphtml". J'ai constaté ce comportement sur des dizaines de sites e-commerce où des pages catégories filtrées étaient bloquées en noindex pour éviter la duplication, entraînant la désindexation silencieuse des AMP mobiles associées.

En revanche, la notion de "liée correctement" pour les AMP autonomes mérite [A vérifier]. Google ne précise pas si un canonical auto-référent suffit ou s'il faut d'autres signaux (présence dans le sitemap AMP séparé, validation AMP sans erreur, crawl actif). Les tests montrent qu'une AMP autonome dans le sitemap XML sans erreur de validation est généralement indexée, mais la vitesse de découverte varie énormément selon l'autorité du domaine.

Quelles nuances faut-il apporter à cette règle ?

Premier point : le timing. Si vous retirez le noindex d'une page HTML, Google ne recrawl pas instantanément le lien rel="amphtml". Sur des sites avec un crawl budget limité, cela peut prendre plusieurs semaines. Pendant ce temps, la version AMP reste invisible même si techniquement éligible. Forcer un recrawl via l'outil d'inspection d'URL de Search Console accélère le processus.

Deuxième nuance : les AMP hybrides (qui servent à la fois de version mobile et de page autonome selon le contexte) créent des situations ambiguës. Si elles sont découvertes à la fois via rel="amphtml" ET via des liens directs, le statut noindex de la page HTML peut ne pas les bloquer totalement, mais elles risquent de perdre leur association canonique et d'apparaître comme des duplicatas dans l'index.

Dans quels cas cette règle ne s'applique-t-elle pas complètement ?

Si une page AMP reçoit des backlinks externes directs de qualité, Google peut la découvrir et l'indexer même si la page HTML source est en noindex. J'ai observé ce cas sur des articles de blog AMP relayés sur les réseaux sociaux : l'URL AMP entre dans l'index via les liens sociaux, indépendamment du statut de la version HTML.

Autre exception : les sitemaps AMP dédiés. Si vous soumettez un sitemap séparé listant uniquement des URLs AMP avec un canonical auto-référent, Google peut les traiter comme des pages autonomes même si des équivalents HTML existent en noindex ailleurs. C'est une zone grise que Google ne documente pas explicitement, mais les logs de crawl confirment ce comportement.

Impact pratique et recommandations

Que faut-il faire concrètement pour éviter la désindexation des AMP ?

Première étape : auditer toutes les pages HTML portant une balise rel="amphtml" pour vérifier qu'aucune ne porte de directive noindex involontaire. Utilisez Screaming Frog ou un crawler équivalent avec un filtre sur les meta robots et les X-Robots-Tag. Exportez la liste croisée des pages avec rel="amphtml" ET noindex : ce sont vos angles morts.

Deuxième action : si vous devez absolument bloquer une page HTML (duplication, contenu faible, étapes de tunnel), demandez-vous si la version AMP apporte une valeur mobile distincte. Si oui, transformez-la en AMP autonome : retirez le rel="amphtml" de la page HTML, ajoutez un canonical auto-référent sur l'AMP, et incluez l'URL AMP dans votre sitemap XML principal ou un sitemap AMP dédié.

Quelles erreurs éviter dans la gestion des directives d'indexation ?

Ne jamais mettre un noindex "par précaution" sur une page HTML sans vérifier si elle porte un rel="amphtml". C'est l'erreur la plus fréquente en pré-production : on bloque temporairement une page en recette, on oublie de lever le noindex en prod, et l'AMP reste invisible pendant des mois sans alerte.

Évitez aussi de mélanger les signaux. Une page AMP avec un canonical pointant vers une URL HTML en noindex crée une contradiction : Google doit choisir entre respecter le canonical (donc ne pas indexer l'AMP) ou traiter l'AMP comme autonome. En général, il opte pour l'exclusion complète. Assurez-vous que les canonicals pointent toujours vers des URLs indexables.

Comment vérifier que mon site est conforme à cette règle ?

Utilisez la Search Console pour croiser deux rapports : "Couverture" (pages exclues par noindex) et "AMP" (erreurs de validation ou pages AMP non indexées). Si des URLs AMP valides n'apparaissent pas dans l'index alors que leur page HTML est exclue, vous êtes probablement dans le scénario décrit par Mueller.

Pour valider une AMP autonome, testez son URL directement dans l'outil d'inspection d'URL. Vérifiez que Google peut la récupérer, qu'elle porte un canonical auto-référent, et qu'elle apparaît dans le sitemap. Si tous les feux sont verts mais qu'elle n'est toujours pas indexée après plusieurs semaines, [A vérifier] le crawl budget et l'autorité globale du domaine peuvent être en cause.

  • Crawler toutes les pages avec rel="amphtml" et croiser avec les directives noindex (meta robots + X-Robots-Tag)
  • Transformer les AMP critiques en versions autonomes si la page HTML doit rester en noindex
  • Ajouter les URLs AMP autonomes dans un sitemap XML dédié avec un canonical auto-référent
  • Vérifier dans Search Console que les AMP valides apparaissent bien dans l'index mobile
  • Tester l'outil d'inspection d'URL sur les AMP autonomes pour valider la récupération et le canonical
  • Surveiller les logs de crawl pour détecter les AMP découvertes via sitemap vs rel="amphtml"
La gestion des directives noindex et de leurs impacts sur les AMP exige une coordination fine entre développeurs, référenceurs et équipes éditoriales. Les architectures hybrides (HTML + AMP associée, ou AMP standalone selon les cas) multiplient les risques de configurations contradictoires. Si votre site gère un volume important de pages AMP ou si vous constatez des écarts inexpliqués entre les pages HTML indexées et leurs équivalents AMP, il peut être judicieux de faire appel à une agence SEO spécialisée pour auditer votre stack technique et sécuriser l'indexation de vos contenus mobiles.

❓ Questions frequentes

Si je retire le noindex d'une page HTML, combien de temps faut-il pour que Google réindexe l'AMP associée ?
Cela dépend de votre crawl budget. Sur des sites à forte autorité, quelques jours suffisent. Sur des domaines moins prioritaires, cela peut prendre plusieurs semaines. Forcer un recrawl via l'outil d'inspection d'URL de Search Console accélère le processus.
Une AMP autonome peut-elle être indexée si elle n'apparaît dans aucun sitemap ?
Oui, si elle reçoit des liens internes directs ou des backlinks externes. Google peut la découvrir par crawl classique. Cependant, l'inclusion dans un sitemap XML accélère significativement la découverte et réduit le risque d'oubli par le crawler.
Que se passe-t-il si une page AMP porte un canonical vers une URL HTML en noindex ?
Google traite généralement cette configuration comme une exclusion volontaire et n'indexe ni la page HTML ni l'AMP. C'est une contradiction technique qui entraîne souvent une désindexation silencieuse de l'AMP sans alerte dans Search Console.
Comment détecter rapidement les AMP bloquées par un noindex HTML dans Search Console ?
Croisez le rapport "Couverture" (pages exclues par noindex) avec le rapport "AMP" (statut d'indexation). Les URLs AMP valides qui n'apparaissent pas dans l'index alors que leur HTML est exclu sont probablement dans le scénario décrit par Mueller.
Faut-il créer un sitemap AMP séparé ou inclure les URLs AMP dans le sitemap principal ?
Les deux approches fonctionnent. Un sitemap AMP dédié facilite le suivi et le diagnostic, surtout si vous gérez des milliers de pages. L'inclusion dans le sitemap principal simplifie la maintenance mais peut compliquer l'analyse des logs de crawl spécifiques aux AMP.
🏷 Sujets associes
Anciennete & Historique Crawl & Indexation Liens & Backlinks Mobile

🎥 De la même vidéo 32

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1h00 · publiée le 27/07/2018

🎥 Voir la vidéo complète sur YouTube →

Declarations similaires

💬 Commentaires (0)

Soyez le premier à commenter.

2000 caractères restants
🔔

Recevez une analyse complète en temps réel des dernières déclarations de Google

Soyez alerté à chaque nouvelle déclaration officielle Google SEO — avec l'analyse complète incluse.

Aucun spam. Désinscription en 1 clic.