La Singolarità Zero-Day: Dentro Claude Mythos e l'era degli RCE autonomi

17 maggio 2026

Siamo onesti. Per un po’, l’hype dell’ “IA nella cybersecurity” è stato estenuante. Abbiamo visto i vendor applicare un adesivo “basato su IA” a strumenti di analisi statica standard basati su regex, e abbiamo visto script kiddies usare i primi LLM per scrivere email di phishing incredibilmente rumorose e malfunzionanti.

Ma a partire dalla metà del 2026, lo scherzo è ufficialmente finito.

Il panorama della sicurezza offensiva non si è solo spostato; si è fondamentalmente fratturato. Non stiamo più parlando dell’IA come di un “assistente” che aiuta un pentester umano a scrivere un payload complicato. Abbiamo a che fare con agenti completamente autonomi e parallelizzati in grado di ragionare attraverso logiche di business complesse, concatenare vulnerabilità e aprire shell prima ancora che un analista umano abbia finito il suo primo caffè.

Ecco una visione dalle trincee su come appare realmente il panorama dell’IA offensiva in questo momento, dal terrificante ragionamento generale dei modelli di frontiera alla precisione millimetrica degli Small Language Models (SLM).

1. Il colosso del ragionamento generale: Claude Mythos

Se volete capire l’attuale panico nella comunità della sicurezza, non cercate oltre Claude Mythos di Anthropic, rilasciato nell’aprile 2026.

Mythos non ha solo superato i benchmark di valutazione; ha scardinato la metodologia di valutazione di METR (l’organizzazione per la valutazione del rischio dell’IA). Ma ciò che toglie il sonno ai ricercatori di sicurezza è ciò che Mythos ha fatto sul campo. Operando senza un addestramento offensivo esplicito — le sue capacità sono emerse puramente da massicci balzi nel ragionamento generale e nell’autonomia di codifica — Mythos ha scoperto autonomamente migliaia di vulnerabilità precedentemente sconosciute.

Non ha trovato solo semplici bug di cross-site scripting (XSS). Ha trovato una falla di remote code execution (RCE) vecchia di 17 anni nel server NFS di FreeBSD e un difetto del browser vecchio di 27 anni che era sopravvissuto a decenni di revisione umana. E poi? Ha scritto exploit completamente funzionali per loro senza alcuna guida umana.

Questo è il motivo per cui Anthropic ne ha limitato il rilascio tramite il “Project Glasswing”, consentendo solo ai giganti tecnologici (Apple, Microsoft, Google) di blindare le proprie infrastrutture prima che il modello sia ampiamente accessibile. Mythos ha dimostrato un concetto terrificante: la capacità offensiva non è più una scelta di design; è una proprietà emergente di qualsiasi IA sufficientemente intelligente.

2. La produtrizzazione dell’autonomia: XBOW e la morte dei DAST

Mentre Mythos rappresenta la frontiera dell’intelligenza generale, strumenti come XBOW rappresentano la commercializzazione della sicurezza offensiva guidata dall’IA.

Per anni, ci siamo affidati agli scanner DAST (Dynamic Application Security Testing). Il DAST è notoriamente rumoroso, lento e limitato — bombarda semplicemente le applicazioni con enormi elenchi di payload statici e spera che qualcosa funzioni. XBOW, d’altra parte, agisce come un red team digitale.

Ecco come piattaforme come XBOW stanno cambiando le regole del gioco:

Sfruttamento Adattivo: XBOW non invia solo un payload; legge la risposta del server. Se un Web Application Firewall (WAF) lo blocca, XBOW analizza il blocco e muta il payload per bypassare il controllo.
Attacchi alla Logica di Business: Gli scanner tradizionali non possono comprendere il contesto. XBOW utilizza l’IA per eseguire test IDOR (Insecure Direct Object Reference) e BOLA (Broken Object Level Authorization). Può analizzare una pagina, capire che il ruolo utente A non dovrebbe vedere i dati dell’utente B e sfruttare attivamente questa vulnerabilità.
Concatenazione di Vulnerabilità: Uno scanner potrebbe trovare un SSRF (Server-Side Request Forgery). XBOW troverà l’SSRF, farà perno sulla rete interna, estrarrà i metadati AWS e cercherà di trasformare quell’SSRF in un RCE completo.

3. L’economia dell’asimmetria: Una Shell al prezzo di un pranzo

Forse la ricerca più dirompente in uscita nel 2026 non riguarda come l’IA hackera, ma quanto costa.

Storicamente, l’attività offensiva era limitata dal lavoro umano. Un penetration test manuale di alta qualità di un ambiente Active Directory (AD) complesso costa dai 15.000 ai 50.000 dollari e richiede settimane.

Ricerche recenti sugli agenti di penetration testing basati su LLM hanno polverizzato questo modello economico. All’inizio del 2026, i ricercatori hanno testato Excalibur (un agente basato su PentestGPT V2) contro un ambiente Active Directory realistico. L’agente ha compromesso con successo quattro host su cinque, eseguendo movimenti laterali reali.

Il costo? 28,50 dollari in tariffe API.
La velocità? Poiché l’agente non operava in modo lineare — esplorava ogni superficie raggiungibile simultaneamente — ha svolto il lavoro di un team in una frazione del tempo.

Quando il costo marginale dell’esecuzione di una catena di attacco complessa e multi-fase scende quasi a zero, il volume di sondaggi sofisticati sul perimetro esterno scalerà all’infinito.

4. La rivoluzione dei “piccoli modelli” (SLM)

Mentre i modelli di frontiera come Mythos conquistano i titoli dei giornali, la seria sicurezza aziendale si sta spostando verso gli Small Language Models (SLM).

Perché? Perché inviare i propri dati di telemetria di rete altamente sensibili e proprietari a un’API di terze parti è un incubo per la conformità. Le aziende hanno bisogno di modelli on-premise, iper-specializzati, che comprendano i loro ambienti specifici.

Ricerche effettuate tra la fine del 2025 e il 2026 (come le iniziative del dataset SecKnowledge) hanno dimostrato che non serve un modello da mille miliardi di parametri per cacciare bug. Perfezionando gli SLM esclusivamente su tattiche, tecniche e procedure (TTP) degli aggressori, payload di exploit e configurazioni di rete, i ricercatori hanno creato modelli esperti di dominio che girano localmente.

Questi SLM eccellono in:

Threat Hunting guidato da ipotesi: Setacciare log rumorosi senza allucinazioni.
Conformità alla residenza dei dati: Operare interamente all’interno di ambienti air-gapped o altamente limitati.
Velocità: Generare payload di fuzzing localizzati a una velocità che i modelli massicci non possono eguagliare a causa della latenza.

La realtà per i difensori

Come ricercatore, guardare tutto questo svolgersi è sia esaltante che terrificante. I giorni in cui si faceva affidamento sul “dwell time” sono finiti. Se un agente IA viola un perimetro, non ha bisogno di dormire, non fa weekend e processa gli ambienti a velocità di macchina.

L’unica difesa praticabile contro un avversario automatizzato, adattivo e in grado di ragionare è una difesa completamente automatizzata, adattiva e in grado di ragionare. Stiamo entrando in un’era di guerra multi-agente, in cui i vostri SLM difensivi saranno in una costante lotta all’ultimo sangue, in tempo reale, con agenti autonomi offensivi.

La gestione delle patch non è più sufficiente. Se la vostra strategia di sicurezza non tiene conto di un avversario in grado di trovare zero-day più velocemente di quanto possiate programmare una riunione, siete già in ritardo.

Esplora altri approfondimenti tecnici sul Blog di Ghaznix →