Comment détecter une injection de code et limiter les dégâts sur votre site infecté ?

Quiz SEO Express

Testez vos connaissances SEO en 5 questions

Moins d'une minute. Decouvrez ce que vous savez vraiment sur le referencement Google.

🕒 ~1 min 🎯 5 questions

Declaration officielle

Pour les sites infectés par une injection de code, vérifiez la propriété dans Google Webmaster Tools pour accéder aux URLs infectées. Utilisez wget ou curl pour confirmer l'injection en examinant le code source, puis explorez le système de fichiers pour évaluer les dégâts.

🎥 Vidéo source

Extrait d'une vidéo Google Search Central

⏱ 1:35 💬 EN 📅 12/03/2013 ✂ 3 déclarations

Voir sur YouTube →

✂ Autres déclarations de cette vidéo 2 ▾

📅

Declaration officielle du 12 mars 2013 (il y a 13 ans)

⚠ Une declaration plus recente existe sur ce sujet Comment détecter et prévenir les trois types d'injection de code qui sabotent vo... Aurora Morales · 7 mai 2020 Voir la declaration →

TL;DR

Google recommande d'utiliser Search Console pour identifier les URLs infectées par une injection de code, puis de confirmer l'infection avec wget ou curl avant d'explorer le système de fichiers. Cette approche méthodique permet d'évaluer l'ampleur réelle des dégâts plutôt que de paniquer. Le problème : les injections modernes contournent souvent la détection initiale, et le délai entre infection et alerte peut faire exploser la facture.

Ce qu'il faut comprendre

Pourquoi Search Console est-il le point de départ d'une détection d'injection ?

Search Console centralise les alertes de sécurité remontées par le système de détection automatique de Google. Quand le crawler identifie du code suspect, du cloaking ou des redirections malveillantes, il signale les URLs concernées dans la section Sécurité et actions manuelles.

Le premier réflexe consiste donc à vérifier cette propriété pour obtenir une liste initiale des pages compromises. C'est un gain de temps considérable plutôt que de scanner manuellement des milliers de pages. Mais attention : cette liste n'est jamais exhaustive au moment où vous la consultez.

Pourquoi wget ou curl sont-ils indispensables pour confirmer l'infection ?

Les injections de code modernes détectent souvent le user-agent de Googlebot et masquent le contenu malveillant aux navigateurs classiques. Vous pouvez voir une page propre dans Chrome alors que Google crawle du spam pharmaceutique.

wget ou curl permettent de récupérer le code source brut tel qu'il est servi au robot, sans interprétation JavaScript ni cache navigateur. C'est le seul moyen de constater ce que Google voit réellement. Si vous trouvez des scripts obfusqués, des iframes cachés ou des liens externes suspects, vous tenez votre confirmation.

Que signifie explorer le système de fichiers pour évaluer les dégâts ?

Une fois l'injection confirmée côté front, il faut remonter à la source dans l'arborescence serveur. Les fichiers .htaccess modifiés, les scripts PHP injectés dans le thème WordPress, les bibliothèques JavaScript compromises : tout doit être audité.

Cette phase d'exploration révèle l'ampleur réelle de l'attaque. Certaines injections ne touchent que quelques templates, d'autres infectent la base de données ou créent des milliers de pages fantômes dans des répertoires cachés. Sans cette cartographie complète, vous risquez de nettoyer en surface et de laisser la porte ouverte à une réinfection immédiate.

Search Console fournit la liste initiale des URLs compromises détectées par Google
wget ou curl confirment l'injection en récupérant le code source réel servi au crawler
L'exploration serveur identifie tous les fichiers modifiés ou ajoutés par l'attaque
Le délai entre infection et détection peut laisser le temps à l'attaquant de multiplier les points d'entrée
Ne jamais se fier uniquement à l'affichage navigateur : le cloaking fausse complètement le diagnostic

Avis d'un expert SEO

Cette méthodologie est-elle suffisante face aux injections récentes ?

La procédure décrite par Google reste valide comme point de départ, mais elle suppose que l'injection soit déjà détectée. Or, les techniques d'obfuscation modernes retardent cette détection de plusieurs jours, voire semaines. Pendant ce temps, votre site sert du spam, perd des positions et accumule des sanctions manuelles.

Les injections les plus sophistiquées ciblent désormais des fichiers légitimes rarement audités : bibliothèques JavaScript tierces, plugins abandonnés, fichiers de cache. Wget seul ne suffit plus si le code malveillant est chargé de manière conditionnelle selon l'IP ou le référent. [A vérifier] : Google ne précise pas comment gérer les injections qui ne se déclenchent que pour certains segments de trafic.

Quelles sont les limites de Search Console dans ce contexte ?

Search Console ne remonte que les URLs que Googlebot a effectivement crawlées ET analysées comme suspectes. Si votre site compte 50 000 pages et que seules 200 sont crawlées par semaine, une injection récente peut rester invisible pendant des mois dans les sections non prioritaires.

Pire : les attaquants créent souvent des milliers de pages orphelines avec noindex initial, puis basculent en index après quelques jours. Ces pages n'apparaissent jamais dans Search Console avant d'avoir causé des dégâts. Il faut donc croiser avec les logs serveur et un monitoring actif des modifications de fichiers.

Le nettoyage seul résout-il le problème de fond ?

Nettoyer l'injection sans corriger la faille de sécurité initiale garantit une réinfection rapide. La plupart des infections WordPress exploitent des plugins obsolètes ou des thèmes piratés. Supprimer le code malveillant sans patcher le CMS revient à laisser la porte ouverte.

Concrètement, l'exploration du système de fichiers doit identifier non seulement les fichiers modifiés, mais aussi les vecteurs d'entrée : permissions 777 abusives, formulaires sans CSRF token, upload de fichiers non validés. Sans cette analyse, vous perdrez des jours à nettoyer en boucle le même site. Et le temps perdu, c'est du trafic et des revenus qui partent.

Impact pratique et recommandations

Que faut-il faire immédiatement après la détection d'une injection ?

Première action : isoler le site si l'infection est massive. Passer temporairement en maintenance pour stopper la diffusion de contenu malveillant limite les pénalités Google. Simultanément, exportez tous les logs serveur des 30 derniers jours pour tracer le point d'entrée initial.

Ensuite, utilisez wget avec le user-agent Googlebot sur un échantillon d'URLs signalées dans Search Console. Comparez le code source obtenu avec ce que votre navigateur affiche. Si vous constatez des différences significatives, le cloaking est confirmé et l'attaque est probablement plus étendue que ce que Google a détecté.

Comment cartographier précisément l'étendue des dégâts ?

Connectez-vous en SSH et lancez une recherche récursive des fichiers modifiés récemment : find . -type f -mtime -7 pour les 7 derniers jours. Croisez cette liste avec un diff par rapport à une sauvegarde propre si vous en avez une. Les fichiers suspects présentent souvent des timestamps identiques ou des noms génériques : config.php, loader.php, cache.tmp.

Analysez également la base de données : les injections dans WordPress ciblent fréquemment wp_posts pour insérer des liens cachés ou wp_options pour modifier les règles de réécriture. Un simple SELECT cherchant 'eval(', 'base64_decode(' ou 'gzinflate(' révèle 80% des infections courantes. Les attaquants ne font pas toujours dans la subtilité.

Quelles erreurs éviter pendant le nettoyage et la récupération ?

Ne supprimez jamais de fichiers avant d'avoir documenté leur présence et leur contenu. Vous aurez besoin de ces preuves pour comprendre le vecteur d'attaque et éviter une réinfection. Beaucoup de SEO paniquent et effacent tout, puis se retrouvent avec le même problème la semaine suivante.

Autre piège : restaurer une sauvegarde trop ancienne. Si votre backup date d'avant l'infection mais aussi d'avant plusieurs mises à jour de sécurité, vous réintroduisez les failles initiales. Préférez un nettoyage chirurgical fichier par fichier avec validation manuelle.

Vérifier Search Console quotidiennement pour détecter les nouvelles URLs compromises
Tester les pages suspectes avec wget et le user-agent Googlebot pour confirmer le cloaking
Identifier les fichiers modifiés récemment avec find et comparer avec une version propre
Rechercher dans la base de données les patterns d'obfuscation classiques (base64, eval, gzinflate)
Patcher immédiatement le vecteur d'entrée avant de nettoyer le code malveillant
Soumettre une demande de réexamen dans Search Console après nettoyage complet

La détection et le nettoyage d'une injection demandent une expertise technique pointue et une méthodologie rigoureuse. Entre l'analyse des logs, l'identification des vecteurs d'attaque et le patch des failles de sécurité, l'intervention peut s'étaler sur plusieurs jours. Si vous manquez de ressources internes ou que l'infection compromet votre chiffre d'affaires, faire appel à une agence SEO spécialisée en sécurité peut accélérer significativement la récupération et sécuriser durablement votre infrastructure.

❓ Questions frequentes

Search Console détecte-t-il toutes les injections de code ?

Non, Search Console ne remonte que les URLs crawlées par Googlebot et identifiées comme suspectes. Les pages orphelines, les sections non crawlées ou les injections récentes passent souvent inaperçues pendant des semaines.

Pourquoi utiliser wget plutôt que simplement consulter le code source dans Chrome ?

Les injections modernes détectent le user-agent et masquent le contenu malveillant aux navigateurs classiques. Wget avec le user-agent Googlebot récupère le code réel servi au crawler, sans interprétation JavaScript ni cache.

Combien de temps faut-il pour nettoyer complètement une injection ?

De quelques heures à plusieurs jours selon l'ampleur. Une injection simple sur quelques fichiers se traite rapidement. Une infection massive touchant la base de données et créant des milliers de pages fantômes nécessite une cartographie complète et un nettoyage méthodique.

Faut-il toujours restaurer une sauvegarde ou peut-on nettoyer manuellement ?

Le nettoyage manuel est préférable si vous avez des sauvegardes anciennes. Restaurer un backup d'avant l'infection peut réintroduire les failles de sécurité initiales. Mieux vaut identifier et supprimer chirurgicalement les fichiers compromis.

Comment éviter une réinfection après le nettoyage ?

Patcher impérativement le vecteur d'entrée : mettre à jour CMS, plugins et thèmes, corriger les permissions fichiers abusives, renforcer la validation des uploads. Sans correction de la faille initiale, le site sera réinfecté en quelques jours.

🏷 Sujets associes

injection code malware Search Console sécurité site cloaking nettoyage infection wget crawl

Nom de domaine PDF & Fichiers Search Console

🎥 De la même vidéo 2

Autres enseignements SEO extraits de cette même vidéo Google Search Central · durée 1 min · publiée le 12/03/2013

🎥 Voir la vidéo complète sur YouTube →

Declarations similaires

« Precedent

L'utilisation d'une installation propre plutôt que...

Exemples de Code Malveillant Injecté...

« Retour aux resultats