Faut-il vraiment masquer les liens de navigation dans un site e-commerce ?

Declaration officielle

Au lieu de masquer des liens ou d'utiliser uniquement des techniques JavaScript pour gérer les vastes catalogues, il est conseillé de rendre certains contenus accessibles via des balises "rel=nofollow" ou des balises canoniques, et non pas simplement cacher ces liens.

5:57

🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 56:00 💬 EN 📅 21/02/2020 ✂ 10 déclarations

Voir sur YouTube (5:57) →

✂ Autres déclarations de cette vidéo 9 ▾

2:15 Peut-on vraiment retirer des liens des résultats de recherche sans toucher à l'index ?
4:48 Faut-il vraiment montrer à Googlebot une version sans publicité de vos pages ?
11:04 Le balisage Site Search Box est-il vraiment inutile pour afficher la boîte de recherche dans Google ?
15:54 Googlebot explore-t-il vraiment des millions de pages sur les très grands sites ?
29:01 Les tests A/B peuvent-ils vraiment nuire à votre référencement naturel ?
35:29 Googlebot exécute-t-il vraiment tout votre JavaScript ou vous bluffe-t-il ?
47:06 Fusionner deux sites : pourquoi le trafic cumulé n'est-il jamais garanti ?
50:35 L'emplacement du serveur influence-t-il vraiment le classement Google ?
55:00 Faut-il vraiment abandonner les domaines nationaux pour un .com générique en SEO international ?

Ce qu'il faut comprendre

Pourquoi Google met-il en garde contre le masquage des liens ?

La déclaration de Mueller vise un problème récurrent sur les sites e-commerce à large catalogue. Beaucoup de développeurs tentent de limiter l'exposition de certaines pages en masquant des liens via CSS (display: none), en les chargeant uniquement en JavaScript, ou en utilisant des techniques d'obfuscation.

Le problème ? Googlebot interprète ces pratiques comme une tentative de manipulation. Si un lien est invisible pour l'utilisateur mais présent dans le code, Google considère ça comme du cloaking. Si le lien n'est accessible que via JavaScript complexe, le crawler peut ne jamais le découvrir — ou le découvrir avec un délai significatif.

Que propose Google comme alternative concrète ?

Mueller suggère deux approches complémentaires : rel="nofollow" et les balises canoniques. Le nofollow indique à Google de ne pas transmettre de PageRank via ce lien, tout en permettant sa découverte. La balise canonical, elle, consolide le jus SEO vers une version préférentielle quand plusieurs URLs similaires existent.

Ces deux techniques permettent de garder les liens visibles pour le crawler tout en contrôlant la distribution du crawl budget et du PageRank. C'est particulièrement utile pour les facettes de navigation, les filtres de tri, ou les pages de pagination profonde qui ne méritent pas d'être indexées mais doivent rester crawlables.

Dans quels contextes cette recommandation s'applique-t-elle ?

Cette consigne concerne principalement les sites avec des milliers de combinaisons possibles de filtres, tris, et facettes. Pensez aux sites de mode avec taille × couleur × matière × prix, ou aux marketplaces avec des centaines de milliers de références.

Le risque, c'est de gaspiller le crawl budget sur des pages à faible valeur ajoutée. Google peut passer des jours à explorer des variations inutiles pendant que vos pages stratégiques restent sous-crawlées. D'où l'intérêt de guider activement le bot avec des signaux clairs plutôt que de tout masquer.

Accessibilité avant tout : les liens doivent être découvrables par Googlebot, même s'ils ne transmettent pas de PageRank
Évitez le JavaScript exclusif : ne comptez pas uniquement sur JS pour charger vos liens de navigation profonde
Utilisez rel="nofollow" stratégiquement : sur les facettes, filtres, et tris qui créent des combinaisons infinies
Canonicalisez les variantes : quand plusieurs URLs affichent le même contenu avec des paramètres différents
Le masquage CSS est risqué : display: none sur des liens peut être interprété comme du cloaking si mal utilisé

Avis d'un expert SEO

Cette approche est-elle vraiment la plus efficace ?

Soyons honnêtes : la recommandation de Mueller est prudente mais parfois insuffisante pour les gros sites. Le rel="nofollow" a perdu beaucoup de son pouvoir de contrôle depuis que Google l'a transformé en "hint" plutôt qu'en directive stricte. [A vérifier] : aucune donnée publique ne confirme dans quelle proportion Google ignore ce nofollow sur les liens internes.

En pratique terrain, on observe que Google crawle quand même certains liens nofollow, surtout s'ils sont très présents dans l'architecture du site. La canonical, elle, fonctionne mieux — mais uniquement si le contenu des pages est réellement similaire. Sur des facettes très différentes, Google peut rejeter la canonical.

Quelles sont les limites de cette recommandation ?

Mueller ne mentionne pas robots.txt, meta robots noindex, ni les paramètres URL dans la Search Console — trois leviers pourtant cruciaux pour gérer le crawl des catalogues. Le robots.txt bloque carrément l'accès, le noindex autorise le crawl mais empêche l'indexation, et les paramètres URL permettent de signaler à Google comment traiter chaque type de paramètre.

Deuxième limite : la déclaration ne distingue pas crawl budget et PageRank. Un nofollow limite (en théorie) le PageRank, mais pas nécessairement le crawl. Si vous avez 500 000 facettes en nofollow, Googlebot peut quand même perdre des semaines à tout parcourir. La vraie question, c'est : comment structurer l'architecture pour que Google ne découvre même pas ces URLs inutiles ?

Que faire quand les liens JavaScript sont inévitables ?

Certains frameworks (React, Vue, Angular en mode SPA) génèrent tout le contenu côté client. Dans ces cas, le Server-Side Rendering (SSR) ou la génération statique deviennent indispensables. Google crawle le JavaScript, certes — mais avec un délai et un coût en crawl budget non négligeable.

L'alternative pragmatique : un système de navigation hybride avec des liens HTML classiques pour les chemins critiques et du JavaScript pour les interactions secondaires. Pas glamour, mais efficace. Et si vraiment vous ne pouvez pas éviter le JS pur, assurez-vous au minimum que les URLs clés sont présentes dans un sitemap XML crawlable sans exécution JS.

Attention : masquer des liens pour "optimiser" le crawl budget sans offrir d'alternative de navigation peut créer des silos involontaires. Vos catégories profondes risquent de ne jamais être découvertes si aucun lien HTML ne pointe vers elles.

Impact pratique et recommandations

Comment auditer votre architecture de liens actuelle ?

Première étape : crawler votre site comme Googlebot avec Screaming Frog, Oncrawl ou Sitebulb en mode "Googlebot smartphone". Identifiez les liens masqués en CSS (display: none, visibility: hidden sur des parents) et les liens chargés uniquement en JavaScript après interaction utilisateur.

Comparez ensuite le nombre de pages crawlées par votre outil versus le nombre de pages indexées dans Google (requête site:). Un écart important suggère que Google ignore une partie de votre contenu — ou au contraire indexe des facettes que vous pensiez avoir bloquées. Examinez aussi les logs serveur pour voir quelles URLs Googlebot visite réellement.

Quelles erreurs critiques faut-il absolument éviter ?

Erreur numéro 1 : mettre des liens importants uniquement derrière du JavaScript événementiel. Si un utilisateur doit cliquer sur un bouton pour charger dynamiquement un menu déroulant, Googlebot ne verra jamais ces liens. Même en 2025, le crawling JS reste coûteux et incomplet.

Erreur numéro 2 : utiliser display: none sur des sections entières de navigation pour les masquer sur mobile. Google détecte ça et peut considérer que vous cachez du contenu intentionnellement. Préférez un CSS qui réduit visuellement l'importance sans masquer (réduction de taille, collapse avec aria-expanded, off-canvas accessible).

Quelle stratégie adopter pour un catalogue de plusieurs milliers de produits ?

La solution la plus robuste : une architecture en silo stricte avec navigation horizontale limitée. Chaque catégorie principale a ses sous-catégories et produits, mais les facettes (couleur, taille, prix) génèrent des URLs canonicalisées vers la page catégorie de base.

Utilisez robots.txt pour bloquer carrément les paramètres de tri (ex: ?sort=price), meta robots noindex sur les pages de pagination profonde (page 10+), et rel="nofollow" sur les liens de filtres combinés. Enfin, soumettez un sitemap XML propre avec uniquement les URLs que vous voulez vraiment indexer — pas les 3 millions de variantes possibles.

Crawler le site avec un outil qui simule Googlebot et comparer avec l'indexation réelle
Identifier tous les liens masqués en CSS ou chargés uniquement en JavaScript
Remplacer les techniques de masquage par rel="nofollow" et canonical quand approprié
Bloquer les paramètres non essentiels via robots.txt ou Search Console
Mettre en noindex les pages de pagination profonde et facettes combinées
Créer un sitemap XML contenant uniquement les URLs prioritaires

La gestion des liens dans un catalogue e-commerce exige un équilibre délicat entre accessibilité pour Googlebot et contrôle du crawl budget. Privilégiez toujours la transparence — liens visibles, signaux clairs — plutôt que les techniques de dissimulation. Ces optimisations demandent une analyse fine de votre architecture et de vos logs serveur, souvent difficile à mener seul. Pour un audit complet et des recommandations sur mesure adaptées à votre plateforme, l'accompagnement d'une agence SEO spécialisée en e-commerce peut faire gagner un temps précieux et éviter des erreurs coûteuses.

❓ Questions frequentes

Le rel="nofollow" sur les liens internes empêche-t-il vraiment Google de les crawler ?

Non. Depuis que Google a transformé le nofollow en "hint", il peut choisir de suivre ces liens quand même. Le nofollow limite surtout la transmission de PageRank, pas forcément la découverte.

Peut-on utiliser display: none sur des liens sans risque de pénalité ?

C'est risqué. Si les liens masqués en CSS ne sont pas visibles pour l'utilisateur mais crawlables, Google peut considérer ça comme du cloaking ou de la manipulation. Préférez des solutions CSS qui réduisent visuellement sans masquer complètement.

Les balises canonical suffisent-elles pour gérer toutes les facettes d'un catalogue ?

Non. La canonical fonctionne bien quand le contenu est très similaire, mais Google peut la rejeter si les pages diffèrent trop. Combinez-la avec noindex, robots.txt et une architecture propre pour un contrôle optimal.

Faut-il bloquer les facettes en robots.txt ou les laisser en noindex ?

Robots.txt bloque le crawl complètement, ce qui économise le crawl budget mais empêche Google de voir les liens sur ces pages. Noindex permet le crawl mais empêche l'indexation — utile si ces pages contiennent des liens vers du contenu important.

Comment savoir si Google crawle mes liens JavaScript ?

Consultez les logs serveur et comparez avec l'index (site:). Utilisez aussi l'outil d'inspection d'URL dans Search Console pour voir la version rendue. Si des URLs ne sont pas découvertes, c'est que le JS n'est pas exécuté correctement.

🎥 De la même vidéo 9

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 56 min · publiée le 21/02/2020

🎥 Voir la vidéo complète sur YouTube →