La Singularité Zero-Day : Au cœur de Claude Mythos et de l'ère des RCE autonomes

17 mai 2026

Soyons honnêtes. Pendant un certain temps, le battage médiatique autour de l’« IA en cybersécurité » a été épuisant. Nous avons vu des fournisseurs coller une étiquette « propulsé par l’IA » sur des outils d’analyse statique standard basés sur des regex, et nous avons vu des script kiddies utiliser les premiers LLM pour rédiger des e-mails de phishing incroyablement bruyants et mal ficelés.

Mais depuis la mi-2026, la plaisanterie est officiellement terminée.

Le paysage de la sécurité offensive n’a pas seulement changé ; il s’est fondamentalement fracturé. Nous ne parlons plus de l’IA comme d’un « assistant » qui aide un pentester humain à écrire une charge utile complexe. Nous avons affaire à des agents totalement autonomes et parallélisés capables de raisonner à travers des logiques métier complexes, d’enchaîner les vulnérabilités et de prendre le contrôle de serveurs avant même qu’un analyste humain n’ait fini son premier café.

Voici un aperçu du front sur ce à quoi ressemble réellement le paysage de l’IA offensive en ce moment, du raisonnement général terrifiant des modèles de pointe à la précision chirurgicale des Small Language Models (SLM).

1. Le géant du raisonnement général : Claude Mythos

Si vous voulez comprendre la panique actuelle dans la communauté de la sécurité, ne cherchez pas plus loin que Claude Mythos d’Anthropic, sorti en avril 2026.

Mythos n’a pas seulement réussi les tests d’évaluation ; il a brisé la méthodologie d’évaluation de METR (l’organisation d’évaluation des risques liés à l’IA). Mais ce qui empêche les chercheurs en sécurité de dormir, c’est ce que Mythos a fait sur le terrain. Opérant sans formation offensive explicite — ses capacités ont émergé purement de bonds massifs dans le raisonnement général et l’autonomie de codage — Mythos a découvert de manière autonome des milliers de vulnérabilités jusqu’alors inconnues.

Il n’a pas seulement trouvé des bogues faciles de cross-site scripting (XSS). Il a trouvé une faille d’exécution de code à distance (RCE) vieille de 17 ans dans le serveur NFS de FreeBSD et un défaut de navigateur vieux de 27 ans qui avait survécu à des décennies de revue par des humains. Et après ? Il a écrit des exploits entièrement fonctionnels sans aucune intervention humaine.

C’est pourquoi Anthropic a restreint sa diffusion via le « Project Glasswing », permettant uniquement aux géants de la technologie (Apple, Microsoft, Google) de renforcer leur infrastructure avant que le modèle ne soit largement accessible. Mythos a prouvé un concept terrifiant : la capacité offensive n’est plus un choix de conception ; c’est une propriété émergente de toute IA suffisamment intelligente.

2. La productisation de l’autonomie : XBOW et la mort du DAST

Alors que Mythos représente la frontière de l’intelligence générale, des outils comme XBOW représentent la commercialisation de la sécurité offensive pilotée par l’IA.

Pendant des années, nous nous sommes appuyés sur les scanners Dynamic Application Security Testing (DAST). Le DAST est notoirement bruyant, lent et limité — il bombarde simplement les applications avec d’énormes listes de charges utiles statiques en espérant que quelque chose fonctionne. XBOW, en revanche, agit comme une red team numérique.

Voici comment les plateformes comme XBOW changent la donne :

Exploitation Adaptative : XBOW n’envoie pas seulement une charge utile ; il lit la réponse du serveur. Si un pare-feu d’application Web (WAF) la bloque, XBOW analyse le blocage et mute la charge utile pour contourner la protection.
Attaques sur la Logique Métier : Les scanners traditionnels ne peuvent pas comprendre le contexte. XBOW utilise l’IA pour effectuer des tests IDOR (Insecure Direct Object Reference) et BOLA (Broken Object Level Authorization). Il peut analyser une page, comprendre que l’utilisateur de rôle A ne devrait pas voir les données de l’utilisateur B, et l’exploiter activement.
Enchaînement de Vulnérabilités : Un scanner pourrait trouver un SSRF (Server-Side Request Forgery). XBOW trouvera le SSRF, pivotera vers le réseau interne, extraira les métadonnées AWS et tentera de transformer ce SSRF en un RCE complet.

3. L’économie de l’asymétrie : Un accès pour le prix d’un déjeuner

Peut-être que la recherche la plus perturbatrice de 2026 ne concerne pas comment l’IA pirate, mais combien cela coûte.

Historiquement, l’activité offensive était limitée par le travail humain. Un test d’intrusion manuel de haute qualité d’un environnement Active Directory (AD) complexe coûte entre 15 000 et 50 000 dollars et prend des semaines.

Des recherches récentes sur les agents de test d’intrusion basés sur les LLM ont pulvérisé ce modèle économique. Début 2026, des chercheurs ont testé Excalibur (un agent basé sur PentestGPT V2) contre un environnement Active Directory réaliste. L’agent a réussi à compromettre quatre serveurs sur cinq, en effectuant des mouvements latéraux réels.

Le coût ? 28,50 dollars en frais d’API.
La vitesse ? Parce que l’agent n’opérait pas de manière linéaire — il explorait chaque surface accessible simultanément — il a accompli le travail d’une équipe en une fraction du temps.

Lorsque le coût marginal de l’exécution d’une chaîne d’attaque complexe et multi-étapes tombe à presque zéro, le volume de sondages sophistiqués sur le périmètre externe augmentera à l’infini.

4. La révolution des « petits modèles » (SLM)

Alors que les modèles de pointe comme Mythos font la une des journaux, la sécurité d’entreprise sérieuse se tourne vers les Small Language Models (SLM).

Pourquoi ? Parce que l’envoi de votre télémétrie réseau hautement sensible et propriétaire à une API tierce est un cauchemar en termes de conformité. Les entreprises ont besoin de modèles sur site, hyper-spécialisés, qui comprennent leurs environnements spécifiques.

Des recherches menées fin 2025 et en 2026 (comme les initiatives de jeux de données SecKnowledge) ont prouvé qu’il n’est pas nécessaire d’avoir un modèle de mille milliards de paramètres pour chasser les bogues. En affinant les SLM exclusivement sur les tactiques, techniques et procédures (TTP) des attaquants, les charges utiles d’exploitation et les configurations réseau, les chercheurs ont créé des modèles experts du domaine qui s’exécutent localement.

Ces SLM excellent dans :

La chasse aux menaces basée sur des hypothèses : Passer au crible des journaux bruyants sans hallucinations.
La conformité de la résidence des données : Fonctionner entièrement dans des environnements isolés ou hautement restreints.
La vitesse : Générer des charges utiles de fuzzing localisées à une vitesse que les modèles massifs ne peuvent pas atteindre en raison de la latence.

La réalité pour les défenseurs

En tant que chercheur, observer cette évolution est à la fois exaltant et terrifiant. L’époque où l’on comptait sur le « dwell time » (temps de présence) est révolue. Si un agent d’IA franchit un périmètre, il n’a pas besoin de dormir, il ne prend pas de week-ends et il traite les environnements à la vitesse d’une machine.

La seule défense viable contre un adversaire automatisé, adaptatif et capable de raisonner est une défense complètement automatisée, adaptative et capable de raisonner. Nous entrons dans une ère de guerre multi-agents, où vos SLM défensifs seront dans un combat au corps à corps constant et en temps réel avec des agents autonomes offensifs.

La gestion des correctifs n’est plus suffisante. Si votre stratégie de sécurité ne tient pas compte d’un adversaire capable de trouver des zero-days plus rapidement que vous ne pouvez organiser une réunion, vous avez déjà pris du retard.

Découvrez plus d’analyses techniques sur le blog de Ghaznix →