تکینگی روز صفر: نگاهی به کلود میتوس و عصر RCE خودگردان
بیایید صادق باشیم. برای مدتی، هیاهوی “هوش مصنوعی در امنیت سایبری” طاقتفرسا بود. ما شاهد بودیم که فروشندگان برچسب “قدرت گرفته از هوش مصنوعی” را روی ابزارهای تحلیل ایستای استاندارد مبتنی بر ریجکس (regex) میچسباندند و شاهد بودیم که هکرهای آماتور از مدلهای زبانی اولیه برای نوشتن ایمیلهای فیشینگ بسیار پر سر و صدا و ناکارآمد استفاده میکردند.
اما از اواسط سال ۲۰۲۶، شوخی رسماً تمام شده است.
چشمانداز امنیت تهاجمی نه تنها تغییر کرده، بلکه به طور اساسی دگرگون شده است. ما دیگر در مورد هوش مصنوعی به عنوان یک “دستیار” که به یک پنتستر (نفوذگر) انسانی کمک میکند تا یک پیلود پیچیده بنویسد صحبت نمیکنیم. ما با عوامل کاملاً خودگردان و موازی سر و کار داریم که میتوانند از طریق منطق تجاری پیچیده استدلال کنند، آسیبپذیریها را به هم زنجیره کنند و پیش از آنکه یک تحلیلگر انسانی حتی اولین فنجان قهوه خود را تمام کند، دسترسی سطح بالا (Shell) بگیرند.
در اینجا نگاهی داریم از خط مقدم به آنچه چشمانداز هوش مصنوعی تهاجمی در حال حاضر واقعاً به نظر میرسد؛ از استدلال عمومی ترسناک مدلهای پیشرو تا دقت بسیار بالای مدلهای زبانی کوچک (SLM).
۱. غول استدلال عمومی: کلود میتوس (Claude Mythos)
اگر میخواهید وحشت فعلی در جامعه امنیتی را درک کنید، به کلود میتوس از شرکت آنتروپیک که در آوریل ۲۰۲۶ عرضه شد، نگاه کنید.
میتوس نه تنها بنچمارکهای ارزیابی را پشت سر گذاشت، بلکه متدولوژی ارزیابی METR (سازمان ارزیابی ریسک هوش مصنوعی) را نیز درهم شکست. اما آنچه محققان امنیتی را شبها بیدار نگه میدارد، کاری است که میتوس در دنیای واقعی انجام داد. میتوس بدون آموزش صریح تهاجمی – در حالی که تواناییهایش صرفاً از جهشهای عظیم در استدلال عمومی و خودمختاری کدنویسی پدیدار شده بود – به طور خودگردان هزاران آسیبپذیری ناشناخته را کشف کرد.
این مدل نه تنها باگهای ساده اسکریپتنویسی بینسایتی (XSS) را پیدا کرد، بلکه یک نقص اجرای کد از راه دور (RCE) ۱۷ ساله در سرور NFS سیستمعامل FreeBSD و یک نقص مرورگر ۲۷ ساله را پیدا کرد که از دههها بازبینی انسانی جان سالم به در برده بود. و بعد؟ این مدل بدون هیچ راهنمایی انسانی، اکسپلویتهای کاملاً کاربردی برای آنها نوشت.
به همین دلیل است که آنتروپیک انتشار آن را از طریق “پروژه گلاسوینگ” محدود کرده است و تنها به غولهای فناوری (اپل، مایکروسافت، گوگل) اجازه میدهد تا زیرساختهای خود را پیش از دسترسی گسترده به مدل، مقاومسازی کنند. میتوس یک مفهوم ترسناک را ثابت کرد: توانایی تهاجمی دیگر یک انتخاب در طراحی نیست، بلکه یک ویژگی نوظهور از هر هوش مصنوعی به اندازه کافی هوشمند است.
۲. محصولسازی خودمختاری: XBOW و مرگ DAST
در حالی که میتوس مرز هوش عمومی را نشان میدهد، ابزارهایی مانند XBOW تجاریسازی امنیت تهاجمی مبتنی بر هوش مصنوعی را نشان میدهند.
سالها ما به اسکنرهای تست امنیت اپلیکیشن پویا (DAST) تکیه میکردیم. DAST به پر سر و صدا بودن، کندی و حماقت معروف است؛ این اسکنرها فقط لیستهای عظیمی از پیلودهای ایستا را به سمت اپلیکیشنها پرتاب میکنند و امیدوارند چیزی جواب دهد. از سوی دیگر، XBOW مانند یک تیم قرمز (Red Team) دیجیتال عمل میکند.
در اینجا نحوه تغییر بازی توسط پلتفرمهایی مانند XBOW آورده شده است:
- بهرهبرداری تطبیقی: XBOW فقط یک پیلود نمیفرستد، بلکه پاسخ سرور را میخواند. اگر یک فایروال اپلیکیشن وب (WAF) آن را مسدود کند، XBOW بلوک را تحلیل کرده و پیلود را برای دور زدن محافظ تغییر میدهد.
- حملات منطق تجاری: اسکنرهای سنتی نمیتوانند زمینه را درک کنند. XBOW از هوش مصنوعی برای انجام تستهای IDOR و BOLA استفاده میکند. این ابزار میتواند یک صفحه را نگاه کند، درک کند که نقش کاربری A نباید دادههای کاربر B را ببیند و فعالانه از آن بهرهبرداری کند.
- زنجیرهسازی آسیبپذیری: یک اسکنر ممکن است یک SSRF پیدا کند. XBOW آن SSRF را پیدا میکند، به شبکه داخلی نفوذ میکند، متادیتای AWS را استخراج میکند و تلاش میکند تا آن SSRF را به یک RCE کامل تبدیل کند.
۳. اقتصاد عدم تقارن: یک دسترسی به قیمت یک ناهار
شاید مخربترین تحقیقی که در سال ۲۰۲۶ منتشر شده نه در مورد نحوه هک هوش مصنوعی، بلکه در مورد هزینه آن باشد.
از لحاظ تاریخی، فعالیت تهاجمی توسط نیروی کار انسانی محدود میشد. یک تست نفوذ دستی با کیفیت بالا از یک محیط پیچیده اکتیو دایرکتوری (AD) بین ۱۵,۰۰۰ تا ۵۰,۰۰۰ دلار هزینه دارد و هفتهها زمان میبرد.
تحقیقات اخیر روی عوامل تست نفوذ مبتنی بر مدلهای زبانی بزرگ، این مدل اقتصادی را نابود کرده است. در اوایل سال ۲۰۲۶، محققان Excalibur (عاملی ساخته شده بر پایه PentestGPT V2) را در برابر یک محیط واقعی اکتیو دایرکتوری آزمایش کردند. این عامل با موفقیت چهار میزبان از پنج میزبان را هک کرد و جابجایی جانبی واقعی را انجام داد.
- هزینه؟ ۲۸.۵۰ دلار در هزینههای API.
- سرعت؟ از آنجایی که عامل به صورت خطی عمل نمیکرد – و هر سطح قابل دسترسی را به طور همزمان جستجو میکرد – کار یک تیم را در کسری از زمان انجام داد.
هنگامی که هزینه نهایی اجرای یک زنجیره حمله پیچیده و چند مرحلهای به نزدیکی صفر میرسد، حجم جستجوهای پیچیده روی محیط خارجی به صورت نامحدود افزایش مییابد.
۴. انقلاب “مدلهای کوچک” (SLM)
در حالی که مدلهای پیشرو مانند میتوس سرفصل اخبار را به خود اختصاص میدهند، امنیت جدی سازمانی به سمت مدلهای زبانی کوچک (SLM) حرکت میکند.
چرا؟ زیرا ارسال تلمتری شبکه بسیار حساس و اختصاصی شما به یک API شخص ثالث، یک کابوس برای انطباق (Compliance) است. سازمانها به مدلهای محلی و بسیار تخصصی نیاز دارند که محیطهای خاص آنها را درک کنند.
تحقیقات در اواخر سال ۲۰۲۵ و ۲۰۲۶ ثابت کرد که برای شکار باگها نیازی به مدلی با تریلیونها پارامتر ندارید. با آموزش دقیق مدلهای کوچک منحصراً روی تاکتیکها، تکنیکها و روشهای مهاجمان (TTPs)، پیلودهای اکسپلویت و پیکربندیهای شبکه، محققان مدلهای متخصصی ساختهاند که به صورت محلی اجرا میشوند.
این مدلهای کوچک در موارد زیر برتری دارند:
- شکار تهدید مبتنی بر فرضیه: غربالگری لاگهای پر سر و صدا بدون توهم (Hallucination).
- انطباق با محل اقامت دادهها: فعالیت کامل در محیطهای ایزوله یا بسیار محدود.
- سرعت: تولید پیلودهای فازینگ (Fuzzing) محلی با سرعتی که مدلهای غولپیکر به دلیل تاخیر (Latency) نمیتوانند به آن برسند.
واقعیت برای مدافعان
به عنوان یک محقق، تماشای این رویدادها هم هیجانانگیز و هم ترسناک است. روزهای تکیه بر “زمان حضور مهاجم” (Dwell Time) به پایان رسیده است. اگر یک عامل هوش مصنوعی به یک محیط نفوذ کند، نیازی به خواب ندارد، آخر هفتهها تعطیل نیست و محیطها را با سرعت ماشین پردازش میکند.
تنها دفاع عملی در برابر یک دشمن خودکار، تطبیقی و استدلالگر، یک دفاع کاملاً خودکار، تطبیقی و استدلالگر است. ما در حال ورود به عصر جنگهای چندعاملی هستیم، جایی که مدلهای کوچک دفاعی شما در یک نبرد تنبهتن همیشگی و بلادرنگ با عوامل خودگردان تهاجمی خواهند بود.
مدیریت وصلههای امنیتی دیگر کافی نیست. اگر استراتژی امنیتی شما دشمنی را که میتواند روزهای صفر را سریعتر از زمان برنامهریزی یک جلسه پیدا کند در نظر نگیرد، همین حالا هم عقب ماندهاید.