تکینگی روز صفر: نگاهی به کلود میتوس و عصر RCE خودگردان

17 مهٔ 2026

بیایید صادق باشیم. برای مدتی، هیاهوی “هوش مصنوعی در امنیت سایبری” طاقت‌فرسا بود. ما شاهد بودیم که فروشندگان برچسب “قدرت گرفته از هوش مصنوعی” را روی ابزارهای تحلیل ایستای استاندارد مبتنی بر ریجکس (regex) می‌چسباندند و شاهد بودیم که هکرهای آماتور از مدل‌های زبانی اولیه برای نوشتن ایمیل‌های فیشینگ بسیار پر سر و صدا و ناکارآمد استفاده می‌کردند.

اما از اواسط سال ۲۰۲۶، شوخی رسماً تمام شده است.

چشم‌انداز امنیت تهاجمی نه تنها تغییر کرده، بلکه به طور اساسی دگرگون شده است. ما دیگر در مورد هوش مصنوعی به عنوان یک “دستیار” که به یک پنتستر (نفوذگر) انسانی کمک می‌کند تا یک پی‌لود پیچیده بنویسد صحبت نمی‌کنیم. ما با عوامل کاملاً خودگردان و موازی سر و کار داریم که می‌توانند از طریق منطق تجاری پیچیده استدلال کنند، آسیب‌پذیری‌ها را به هم زنجیره کنند و پیش از آنکه یک تحلیلگر انسانی حتی اولین فنجان قهوه خود را تمام کند، دسترسی سطح بالا (Shell) بگیرند.

در اینجا نگاهی داریم از خط مقدم به آنچه چشم‌انداز هوش مصنوعی تهاجمی در حال حاضر واقعاً به نظر می‌رسد؛ از استدلال عمومی ترسناک مدل‌های پیشرو تا دقت بسیار بالای مدل‌های زبانی کوچک (SLM).

۱. غول استدلال عمومی: کلود میتوس (Claude Mythos)

اگر می‌خواهید وحشت فعلی در جامعه امنیتی را درک کنید، به کلود میتوس از شرکت آنتروپیک که در آوریل ۲۰۲۶ عرضه شد، نگاه کنید.

میتوس نه تنها بنچمارک‌های ارزیابی را پشت سر گذاشت، بلکه متدولوژی ارزیابی METR (سازمان ارزیابی ریسک هوش مصنوعی) را نیز درهم شکست. اما آنچه محققان امنیتی را شب‌ها بیدار نگه می‌دارد، کاری است که میتوس در دنیای واقعی انجام داد. میتوس بدون آموزش صریح تهاجمی – در حالی که توانایی‌هایش صرفاً از جهش‌های عظیم در استدلال عمومی و خودمختاری کدنویسی پدیدار شده بود – به طور خودگردان هزاران آسیب‌پذیری ناشناخته را کشف کرد.

این مدل نه تنها باگ‌های ساده اسکریپت‌نویسی بین‌سایتی (XSS) را پیدا کرد، بلکه یک نقص اجرای کد از راه دور (RCE) ۱۷ ساله در سرور NFS سیستم‌عامل FreeBSD و یک نقص مرورگر ۲۷ ساله را پیدا کرد که از دهه‌ها بازبینی انسانی جان سالم به در برده بود. و بعد؟ این مدل بدون هیچ راهنمایی انسانی، اکسپلویت‌های کاملاً کاربردی برای آن‌ها نوشت.

به همین دلیل است که آنتروپیک انتشار آن را از طریق “پروژه گلاس‌وینگ” محدود کرده است و تنها به غول‌های فناوری (اپل، مایکروسافت، گوگل) اجازه می‌دهد تا زیرساخت‌های خود را پیش از دسترسی گسترده به مدل، مقاوم‌سازی کنند. میتوس یک مفهوم ترسناک را ثابت کرد: توانایی تهاجمی دیگر یک انتخاب در طراحی نیست، بلکه یک ویژگی نوظهور از هر هوش مصنوعی به اندازه کافی هوشمند است.

۲. محصول‌سازی خودمختاری: XBOW و مرگ DAST

در حالی که میتوس مرز هوش عمومی را نشان می‌دهد، ابزارهایی مانند XBOW تجاری‌سازی امنیت تهاجمی مبتنی بر هوش مصنوعی را نشان می‌دهند.

سال‌ها ما به اسکنرهای تست امنیت اپلیکیشن پویا (DAST) تکیه می‌کردیم. DAST به پر سر و صدا بودن، کندی و حماقت معروف است؛ این اسکنرها فقط لیست‌های عظیمی از پی‌لودهای ایستا را به سمت اپلیکیشن‌ها پرتاب می‌کنند و امیدوارند چیزی جواب دهد. از سوی دیگر، XBOW مانند یک تیم قرمز (Red Team) دیجیتال عمل می‌کند.

در اینجا نحوه تغییر بازی توسط پلتفرم‌هایی مانند XBOW آورده شده است:

بهره‌برداری تطبیقی: XBOW فقط یک پی‌لود نمی‌فرستد، بلکه پاسخ سرور را می‌خواند. اگر یک فایروال اپلیکیشن وب (WAF) آن را مسدود کند، XBOW بلوک را تحلیل کرده و پی‌لود را برای دور زدن محافظ تغییر می‌دهد.
حملات منطق تجاری: اسکنرهای سنتی نمی‌توانند زمینه را درک کنند. XBOW از هوش مصنوعی برای انجام تست‌های IDOR و BOLA استفاده می‌کند. این ابزار می‌تواند یک صفحه را نگاه کند، درک کند که نقش کاربری A نباید داده‌های کاربر B را ببیند و فعالانه از آن بهره‌برداری کند.
زنجیره‌سازی آسیب‌پذیری: یک اسکنر ممکن است یک SSRF پیدا کند. XBOW آن SSRF را پیدا می‌کند، به شبکه داخلی نفوذ می‌کند، متادیتای AWS را استخراج می‌کند و تلاش می‌کند تا آن SSRF را به یک RCE کامل تبدیل کند.

۳. اقتصاد عدم تقارن: یک دسترسی به قیمت یک ناهار

شاید مخرب‌ترین تحقیقی که در سال ۲۰۲۶ منتشر شده نه در مورد نحوه هک هوش مصنوعی، بلکه در مورد هزینه آن باشد.

از لحاظ تاریخی، فعالیت تهاجمی توسط نیروی کار انسانی محدود می‌شد. یک تست نفوذ دستی با کیفیت بالا از یک محیط پیچیده اکتیو دایرکتوری (AD) بین ۱۵,۰۰۰ تا ۵۰,۰۰۰ دلار هزینه دارد و هفته‌ها زمان می‌برد.

تحقیقات اخیر روی عوامل تست نفوذ مبتنی بر مدل‌های زبانی بزرگ، این مدل اقتصادی را نابود کرده است. در اوایل سال ۲۰۲۶، محققان Excalibur (عاملی ساخته شده بر پایه PentestGPT V2) را در برابر یک محیط واقعی اکتیو دایرکتوری آزمایش کردند. این عامل با موفقیت چهار میزبان از پنج میزبان را هک کرد و جابجایی جانبی واقعی را انجام داد.

هزینه؟ ۲۸.۵۰ دلار در هزینه‌های API.
سرعت؟ از آنجایی که عامل به صورت خطی عمل نمی‌کرد – و هر سطح قابل دسترسی را به طور همزمان جستجو می‌کرد – کار یک تیم را در کسری از زمان انجام داد.

هنگامی که هزینه نهایی اجرای یک زنجیره حمله پیچیده و چند مرحله‌ای به نزدیکی صفر می‌رسد، حجم جستجوهای پیچیده روی محیط خارجی به صورت نامحدود افزایش می‌یابد.

۴. انقلاب “مدل‌های کوچک” (SLM)

در حالی که مدل‌های پیشرو مانند میتوس سرفصل اخبار را به خود اختصاص می‌دهند، امنیت جدی سازمانی به سمت مدل‌های زبانی کوچک (SLM) حرکت می‌کند.

چرا؟ زیرا ارسال تلمتری شبکه بسیار حساس و اختصاصی شما به یک API شخص ثالث، یک کابوس برای انطباق (Compliance) است. سازمان‌ها به مدل‌های محلی و بسیار تخصصی نیاز دارند که محیط‌های خاص آن‌ها را درک کنند.

تحقیقات در اواخر سال ۲۰۲۵ و ۲۰۲۶ ثابت کرد که برای شکار باگ‌ها نیازی به مدلی با تریلیون‌ها پارامتر ندارید. با آموزش دقیق مدل‌های کوچک منحصراً روی تاکتیک‌ها، تکنیک‌ها و روش‌های مهاجمان (TTPs)، پی‌لودهای اکسپلویت و پیکربندی‌های شبکه، محققان مدل‌های متخصصی ساخته‌اند که به صورت محلی اجرا می‌شوند.

این مدل‌های کوچک در موارد زیر برتری دارند:

شکار تهدید مبتنی بر فرضیه: غربالگری لاگ‌های پر سر و صدا بدون توهم (Hallucination).
انطباق با محل اقامت داده‌ها: فعالیت کامل در محیط‌های ایزوله یا بسیار محدود.
سرعت: تولید پی‌لودهای فازینگ (Fuzzing) محلی با سرعتی که مدل‌های غول‌پیکر به دلیل تاخیر (Latency) نمی‌توانند به آن برسند.

واقعیت برای مدافعان

به عنوان یک محقق، تماشای این رویدادها هم هیجان‌انگیز و هم ترسناک است. روزهای تکیه بر “زمان حضور مهاجم” (Dwell Time) به پایان رسیده است. اگر یک عامل هوش مصنوعی به یک محیط نفوذ کند، نیازی به خواب ندارد، آخر هفته‌ها تعطیل نیست و محیط‌ها را با سرعت ماشین پردازش می‌کند.

تنها دفاع عملی در برابر یک دشمن خودکار، تطبیقی و استدلال‌گر، یک دفاع کاملاً خودکار، تطبیقی و استدلال‌گر است. ما در حال ورود به عصر جنگ‌های چندعاملی هستیم، جایی که مدل‌های کوچک دفاعی شما در یک نبرد تن‌به‌تن همیشگی و بلادرنگ با عوامل خودگردان تهاجمی خواهند بود.

مدیریت وصله‌های امنیتی دیگر کافی نیست. اگر استراتژی امنیتی شما دشمنی را که می‌تواند روزهای صفر را سریع‌تر از زمان برنامه‌ریزی یک جلسه پیدا کند در نظر نگیرد، همین حالا هم عقب مانده‌اید.

بینش‌های فنی بیشتری را در وبلاگ غزنکس کاوش کنید ←