A Singularidade Zero-Day: Por dentro do Claude Mythos e a era do RCE autônomo

17 de maio de 2026

Sejamos honestos. Por um tempo, o hype da “IA na cibersegurança” foi exaustivo. Vimos fornecedores colarem um adesivo de “impulsionado por IA” em ferramentas de análise estática padrão baseadas em regex, e vimos script kiddies usarem os primeiros LLMs para escrever e-mails de phishing incrivelmente ruidosos e mal formatados.

Mas, em meados de 2026, a brincadeira acabou oficialmente.

O cenário da segurança ofensiva não apenas mudou; ele se fraturou fundamentalmente. Não estamos mais falando da IA como um “assistente” que ajuda um pentester humano a escrever um payload complicado. Estamos lidando com agentes totalmente autônomos e paralelizados que podem raciocinar através de lógicas de negócios complexas, encadear vulnerabilidades e obter acesso ao servidor (shell) antes mesmo de um analista humano terminar sua primeira xícara de café.

Aqui está uma visão direto do front sobre como o cenário da IA ofensiva realmente se parece agora, desde o aterrador raciocínio geral dos modelos de fronteira até a precisão cirúrgica dos Small Language Models (SLMs).

1. O Gigante do Raciocínio Geral: Claude Mythos

Se você quer entender o pânico atual na comunidade de segurança, não procure além do Claude Mythos da Anthropic, lançado em abril de 2026.

O Mythos não apenas passou nos benchmarks de avaliação; ele quebrou a metodologia de avaliação da METR (a organização de avaliação de risco de IA). Mas o que tira o sono dos pesquisadores de segurança é o que o Mythos fez na prática. Operando sem treinamento ofensivo explícito — suas capacidades surgiram puramente de saltos massivos no raciocínio geral e na autonomia de codificação — o Mythos descobriu autonomamente milhares de vulnerabilidades anteriormente desconhecidas.

Ele não encontrou apenas bugs fáceis de cross-site scripting (XSS). Ele encontrou uma falha de execução remota de código (RCE) de 17 anos no servidor NFS do FreeBSD e uma falha de navegador de 27 anos que havia sobrevivido a décadas de revisão humana. E depois? Ele escreveu exploits totalmente funcionais para eles sem qualquer orientação humana.

É por isso que a Anthropic restringiu seu lançamento através do “Project Glasswing”, permitindo apenas que gigantes da tecnologia (Apple, Microsoft, Google) reforçassem sua infraestrutura antes que o modelo se tornasse amplamente acessível. O Mythos provou um conceito aterrador: a capacidade ofensiva não é mais uma escolha de design; é uma propriedade emergente de qualquer IA suficientemente inteligente.

2. A Produtização da Autonomia: XBOW e a Morte do DAST

Enquanto o Mythos representa a fronteira da inteligência geral, ferramentas como o XBOW representam a comercialização da segurança ofensiva impulsionada por IA.

Por anos, confiamos em scanners de Dynamic Application Security Testing (DAST). O DAST é notoriamente ruidoso, lento e limitado — ele apenas bombardeia aplicações com listas enormes de payloads estáticos e espera que algo funcione. O XBOW, por outro lado, age como uma equipe vermelha (red team) digital.

Veja como plataformas como o XBOW estão mudando o jogo:

Exploração Adaptativa: O XBOW não apenas envia um payload; ele lê a resposta do servidor. Se um Firewall de Aplicação Web (WAF) o bloquear, o XBOW analisa o bloqueio e altera o payload para contornar a proteção.
Ataques de Lógica de Negócio: Scanners tradicionais não conseguem entender o contexto. O XBOW usa IA para realizar testes de IDOR (Referência Direta Insegura a Objeto) e BOLA (Autorização de Nível de Objeto Corrompida). Ele pode olhar para uma página, entender que o usuário com a função A não deveria ver os dados do usuário B e explorar isso ativamente.
Encadeamento de Vulnerabilidades: Um scanner pode encontrar um SSRF (Server-Side Request Forgery). O XBOW encontrará o SSRF, fará um pivô para a rede interna, extrairá metadados da AWS e tentará transformar esse SSRF em um RCE completo.

3. A Economia da Assimetria: Um Shell pelo Preço de um Almoço

Talvez a pesquisa mais disruptiva lançada em 2026 não seja sobre como a IA hackeia, mas sobre quanto custa.

Historicamente, a atividade ofensiva era limitada pelo trabalho humano. Um teste de invasão manual de alta qualidade de um ambiente complexo de Active Directory (AD) custa entre US$ 15.000 e US$ 50.000 e leva semanas.

Pesquisas recentes sobre agentes de teste de invasão baseados em LLM destruíram esse modelo econômico. No início de 2026, pesquisadores testaram o Excalibur (um agente construído sobre o PentestGPT V2) contra um ambiente realista de Active Directory. O agente comprometeu com sucesso quatro de cinco hosts, executando movimentos laterais reais.

O custo? US$ 28,50 em taxas de API.
A velocidade? Como o agente não operava linearmente — ele explorava cada superfície acessível simultaneamente — ele fez o trabalho de uma equipe em uma fração do tempo.

Quando o custo marginal de execução de uma cadeia de ataque complexa e de vários estágios cai para quase zero, o volume de sondagens sofisticadas no perímetro externo escalará infinitamente.

4. A Revolução dos “Modelos Pequenos” (SLMs)

Enquanto os modelos de fronteira como o Mythos ocupam as manchetes, a segurança corporativa séria está se movendo para os Small Language Models (SLMs).

Por quê? Porque enviar sua telemetria de rede altamente sensível e proprietária para uma API de terceiros é um pesadelo de conformidade. As empresas precisam de modelos locais, hiperespecializados, que entendam seus ambientes específicos.

Pesquisas no final de 2025 e 2026 (como as iniciativas do conjunto de dados SecKnowledge) provaram que você não precisa de um modelo de um trilhão de parâmetros para caçar bugs. Ao ajustar SLMs exclusivamente em táticas, técnicas e procedimentos (TTPs) de invasores, payloads de exploit e configurações de rede, os pesquisadores criaram modelos especialistas no domínio que rodam localmente.

Esses SLMs se destacam em:

Caça a Ameaças baseada em Hipóteses: Filtrar logs ruidosos sem alucinações.
Conformidade de Residência de Dados: Operar inteiramente dentro de ambientes isolados ou altamente restritos.
Velocidade: Gerar payloads de fuzzing localizados em uma velocidade que modelos massivos não conseguem igualar devido à latência.

A Realidade para os Defensores

Como pesquisador, observar isso acontecer é ao mesmo tempo empolgante e aterrador. Os dias de depender do “dwell time” (tempo de permanência) acabaram. Se um agente de IA viola um perímetro, ele não precisa dormir, não tira fins de semana e processa ambientes na velocidade da máquina.

A única defesa viável contra um adversário automatizado, adaptativo e capaz de raciocinar é uma defesa completamente automatizada, adaptativa e capaz de raciocinar. Estamos entrando em uma era de guerra multiagente, onde seus SLMs defensivos estarão em uma luta de facas constante e em tempo real com agentes autônomos ofensivos.

O gerenciamento de patches não é mais suficiente. Se a sua estratégia de segurança não leva em conta um adversário que pode encontrar zero-days mais rápido do que você pode agendar uma reunião, você já está atrás.

Explore mais insights técnicos no Blog da Ghaznix →