Сингулярность нулевого дня: внутри Claude Mythos и эра автономного RCE
Давайте будем честными. Какое-то время хайп вокруг «ИИ в кибербезопасности» был изнурительным. Мы наблюдали, как вендоры лепили наклейку «на базе ИИ» на стандартные инструменты статического анализа, основанные на регулярных выражениях, и видели, как «скрипт-кидди» использовали ранние LLM для написания невероятно шумных и нескладных фишинговых писем.
Но по состоянию на середину 2026 года шутки официально закончились.
Ландшафт наступательной безопасности не просто сместился; он фундаментально раскололся. Мы больше не говорим об ИИ как о «помощнике», который помогает человеку-пентестеру написать сложный полезный нагрузку. Мы имеем дело с полностью автономными параллельными агентами, которые могут рассуждать в рамках сложной бизнес-логики, связывать уязвимости в цепочки и получать доступ к серверу (shell) еще до того, как аналитик-человек успеет допить свою первую чашку кофе.
Вот взгляд из «окопов» на то, как на самом деле выглядит ландшафт наступательного ИИ прямо сейчас: от пугающих общих рассуждений передовых моделей до бритвенно-острой точности малых языковых моделей (SLM).
1. Гигант общих рассуждений: Claude Mythos
Если вы хотите понять причину нынешней паники в сообществе безопасности, обратите внимание на Claude Mythos от Anthropic, выпущенную в апреле 2026 года.
Mythos не просто прошла оценочные бенчмарки; она сломала саму методологию оценки METR (организации по оценке рисков ИИ). Но что заставляет исследователей безопасности не спать по ночам, так это то, что Mythos сделала в реальных условиях. Работая без явного наступательного обучения — её способности возникли исключительно благодаря колоссальным скачкам в общих рассуждениях и автономности кодирования — Mythos самостоятельно обнаружила тысячи ранее неизвестных уязвимостей.
Она находила не только простые ошибки межсайтового скриптинга (XSS). Она обнаружила 17-летнюю уязвимость удаленного выполнения кода (RCE) в NFS-сервере FreeBSD и 27-летнюю ошибку в браузере, которая десятилетиями ускользала от внимания экспертов. И что потом? Она написала полностью функциональные эксплойты для них без какого-либо участия человека.
Именно поэтому Anthropic ограничила её выпуск в рамках «Project Glasswing», позволив только технологическим гигантам (Apple, Microsoft, Google) укрепить свою инфраструктуру до того, как модель станет широко доступной. Mythos доказала пугающую концепцию: наступательные возможности больше не являются проектным решением; это эмерджентное свойство любого достаточно умного ИИ.
2. Продуктизация автономности: XBOW и смерть DAST
В то время как Mythos представляет собой фронтир общего интеллекта, такие инструменты, как XBOW, представляют собой коммерциализацию наступательной безопасности под управлением ИИ.
Годами мы полагались на сканеры динамического тестирования безопасности приложений (DAST). DAST печально известен своей шумностью, медлительностью и ограниченностью — он просто бомбардирует приложения огромными списками статических нагрузок и надеется, что что-то сработает. XBOW, с другой стороны, действует как цифровая «красная команда» (Red Team).
Вот как платформы типа XBOW меняют правила игры:
- Адаптивная эксплуатация: XBOW не просто отправляет нагрузку; он считывает ответ сервера. Если WAF (межсетевой экран приложений) блокирует его, XBOW анализирует блокировку и мутирует нагрузку, чтобы обойти защиту.
- Атаки на бизнес-логику: Традиционные сканеры не могут понять контекст. XBOW использует ИИ для проведения тестов IDOR (небезопасная прямая ссылка на объект) и BOLA (нарушенная авторизация на уровне объекта). Он может проанализировать страницу, понять, что пользователь с ролью А не должен видеть данные пользователя Б, и активно использовать это.
- Цепочки уязвимостей: Обычный сканер может найти SSRF (подделка запроса на стороне сервера). XBOW найдет SSRF, проникнет во внутреннюю сеть, извлечет метаданные AWS и попытается превратить этот SSRF в полноценный RCE.
3. Экономика асимметрии: Shell по цене обеда
Возможно, самое революционное исследование 2026 года касается не того, как ИИ взламывает, а того, сколько это стоит.
Исторически наступательная деятельность была ограничена человеческим трудом. Качественный ручной тест на проникновение в сложную среду Active Directory (AD) стоит от 15 000 до 50 000 долларов и занимает недели.
Недавние исследования агентов для тестирования на проникновение на базе LLM уничтожили эту экономическую модель. В начале 2026 года исследователи протестировали Excalibur (агент на базе PentestGPT V2) в реалистичной среде Active Directory. Агент успешно скомпрометировал четыре из пяти хостов, выполняя реальное горизонтальное перемещение.
- Стоимость? 28,50 долларов США за API.
- Скорость? Поскольку агент не работал линейно — он исследовал каждую доступную поверхность одновременно — он выполнил работу целой команды за ничтожную часть времени.
Когда предельные затраты на выполнение сложной многоэтапной цепочки атак падают почти до нуля, объем изощренного зондирования внешнего периметра будет расти бесконечно.
4. Революция «малых моделей» (SLM)
Пока передовые модели типа Mythos попадают в заголовки газет, серьезная корпоративная безопасность переходит на малые языковые модели (SLM).
Почему? Потому что передача ваших сверхчувствительных проприетарных данных сетевой телеметрии в сторонний API — это кошмар для комплаенса. Предприятиям нужны локальные, узкоспециализированные модели, которые понимают их конкретную среду.
Исследования конца 2025 и 2026 годов (такие как инициативы по набору данных SecKnowledge) доказали, что для поиска багов не нужна модель с триллионом параметров. Путем дообучения (fine-tuning) малых моделей исключительно на тактиках, техниках и процедурах (TTP) злоумышленников, полезных нагрузках и сетевых конфигурациях, исследователи создали экспертные модели, работающие локально.
Эти SLM преуспевают в:
- Охоте за угрозами на основе гипотез: Просеивание шумных логов без галлюцинаций.
- Соблюдении требований к локализации данных: Работа полностью внутри изолированных или строго ограниченных сред.
- Скорости: Генерация локализованных нагрузок для фаззинга со скоростью, которую массивные модели не могут обеспечить из-за задержек.
Реальность для защитников
Как исследователь, я нахожу это одновременно захватывающим и пугающим. Времена, когда можно было полагаться на «время пребывания» (dwell time), прошли. Если ИИ-агент прорывает периметр, ему не нужно спать, он не уходит на выходные и обрабатывает среду со скоростью машины.
Единственная жизнеспособная защита от автоматизированного, адаптивного, рассуждающего противника — это полностью автоматизированная, адаптивная, рассуждающая защита. Мы вступаем в эру войн между множеством агентов, где ваши защитные малые модели будут находиться в постоянной битве в реальном времени с наступательными автономными агентами.
Одного управления патчами уже недостаточно. Если ваша стратегия безопасности не учитывает противника, который может находить уязвимости нулевого дня быстрее, чем вы успеете назначить совещание, вы уже проиграли.