چگونه یادگیری ماشین حملات روز صفر (Zero-Day) را شناسایی می‌کند

22 مهٔ 2026

الگوریتم‌های یادگیری ماشین در حال شناسایی و متوقف کردن بهره‌برداری از آسیب‌پذیری روز صفر در یک داشبورد تهدیدات سایبری

برای دهه‌ها، امنیت سایبری یک بازی موش و گربه بوده که بر پایه امضاها (signatures) انجام می‌شد. هنگامی که یک گونه بدافزار جدید یا اکسپلویٹ کشف می‌شد، محققان امنیتی آن را تجزیه و تحلیل می‌کردند، یک امضای دیجیتال منحصر به فرد را استخراج کرده و آن را در پایگاه‌های داده آنتی‌ویروس توزیع می‌کردند.

اما دفاع مبتنی بر امضا یک نقص اساسی دارد: کاملاً واکنشی (reactive) است. این روش نمی‌تواند چیزی را که قبلاً ندیده است، متوقف کند.

اینجاست که حمله روز صفر (Zero-Day Attack) وارد عمل می‌شود—بهره‌برداری از یک آسیب‌پذیری نرم‌افزاری ناشناخته قبل از اینکه توسعه‌دهنده وصله‌ای (patch) برای آن منتشر کند. از آنجا که هیچ امضای وجود ندارد، فایروال‌های سنتی و سیستم‌های پیشگیری از نفوذ (IPS) در برابر آن‌ها کاملاً نابینا می‌مانند.

برای دفاع در برابر تهدیدات روز صفر، این صنعت در حال تجربه یک تغییر پارادایم است: فاصله گرفتن از امضاها و حرکت به سمت تحلیل رفتار، با پشتیبانی یادگیری ماشین (ML).

۱. فراتر از امضاها: مکانیسم شناسایی ناهنجاری‌ها

در قلب دفاع مبتنی بر یادگیری ماشین، مفهوم شناسایی ناهنجاری (anomaly detection) قرار دارد. به جای جستجو برای رفتارهای مخرب شناخته‌شده (امضاها)، مدل‌های یادگیری ماشین آموزش می‌بینند تا درک کنند وضعیت “عادی” در یک سیستم یا شبکه چگونه است و هر چیزی را که از آن خط مبنا (baseline) منحرف شود، پرچم‌گذاری کنند.

ایجاد خط مبنای رفتاری: الگوریتم‌های یادگیری بدون نظارت، مانند جنگل‌های ایزوله (Isolation Forests) و خودرمزگذارها (Autoencoders)، حجم عظیمی از ترافیک شبکه، فعالیت‌های کاربران و لاگ‌های سیستم را پردازش می‌کنند تا یک مدل بسیار دقیق از عملیات عادی بسازند.
امتیازدهی انحراف: هنگامی که یک اکسپلویٹ روز صفر اجرا می‌شود، ناگزیر اقداماتی انجام می‌دهد که از خط مبنا منحرف می‌شود—مانند اجرای یک توالی غیرعادی از فراخوانی‌های API، باز کردن اتصالات پورت غیرمنتظره، یا تلاش برای خواندن حافظه محدود شده سیستم. مدل یادگیری ماشین بلافاصله این رفتار را با امتیاز ناهنجاری بالا نشانه‌گذاری می‌کند.

۲. استخراج ویژگی پویا: تحلیل فایل‌ها در زمان واقعی

اکسپلویٹ‌های روز صفر معمولاً از طریق پیوست‌های ایمیل یا دانلودهای پنهانی در هنگام وبگردی (drive-by downloads) وارد می‌شوند. از آنجا که بررسی‌کننده‌های امضا نمی‌توانند این فایل‌های جدید را پرچم‌گذاری کنند، سیستم‌های مجهز به یادگیری ماشین از استخراج ویژگی‌های ایستا و پویا برای تحلیل آن‌ها در چند میلی‌ثانیه استفاده می‌کنند.

۱. تحلیل ایستا: مدل ساختار فایل، DLLهای ایمپورت شده، فراخوانی‌های توابع API و متادیتا را بدون اجرای فایل تحلیل می‌کند. مدل‌های یادگیری عمیق می‌توانند الگوهای مخرب را حتی در صورت مبهم‌سازی (obfuscate) کد شناسایی کنند. ۲. تحلیل پویا در محیط ایزوله (Sandbox): اگر تحلیل ایستا قطعی نباشد، فایل در یک محیط مجازی امن و ایزوله اجرا می‌شود. عامل یادگیری ماشین اجرای زنده آن را نظارت می‌کند و رفتارهایی مانند موارد زیر را ردیابی می‌کند: * تزریق فرآیند (Process Injection): تلاش برای تزریق کد به فرآیندهای قانونی سیستم (مانند explorer.exe). * تغییرات رجیستری: نوشتن در کلیدهای حساس راه‌اندازی سیستم یا غیرفعال کردن خدمات امنیتی. * ارتقاء سطح دسترسی: درخواست غیرعادی برای دسترسی مدیر سیستم از طریق اکسپلویٹ‌های سیستم.

۳. تحلیل ترافیک شبکه و مدل‌سازی توالی

بسیاری از حملات روز صفر شامل اجرای دستورات از راه دور، سرقت داده‌ها یا حرکت جانبی (Lateral Movement) در سراسر شبکه هستند. یادگیری ماشین با در نظر گرفتن داده‌های تله‌متری شبکه به عنوان توالی از رویدادها، این فعالیت‌ها را نظارت می‌کند.

شبکه‌های LSTM و شبکه‌های عصبی بازگشتی (RNNs): همان‌طور که از شبکه‌های LSTM در پردازش زبان طبیعی (NLP) برای پیش‌بینی کلمه بعدی در یک جمله استفاده می‌شود، در امنیت نیز برای مدل‌سازی جریان‌های شبکه استفاده می‌شوند. مدل توالی معمول ارتباطات بین دستگاه‌ها را یاد می‌گیرد و ناهنجاری‌های مخرب را نشانه‌گذاری می‌کند.
شبکه‌های عصبی گرافی (GNNs): شبکه‌های GNN کل توپولوژی شبکه را به عنوان یک گراف ترسیم می‌کنند، جایی که دستگاه‌ها گره‌ها و ارتباطات یال‌ها هستند. این به مدل اجازه می‌دهد تا حرکت‌های جانبی پنهانی را شناسایی کند که در آن یک مهاجم سعی دارد با استفاده از اکسپلویٹ روز صفر از یک سرور به سرور دیگر بپرد.

۴. چالش‌ها: شمشیر دو لبه دفاع با یادگیری ماشین

اگرچه یادگیری ماشین بسیار قدرتمند است، اما یک راه حل جادویی نیست. ایمن‌سازی سیستم‌ها با یادگیری ماشین با چالش‌های مهندسی خاص خود همراه است:

دوراهی هشدارهای نادرست (False Positives): اگر یک مدل شناسایی ناهنجاری بیش از حد حساس باشد، به‌روزرسانی‌های نرم‌افزاری قانونی یا کارهای مدیریتی را به عنوان حمله نشانه‌گذاری می‌کند که منجر به خستگی ناشی از هشدار در تیم‌های عملیات امنیتی می‌شود.
یادگیری ماشین تقابلی (Adversarial ML): مجرمان سایبری به طور فعال در حال توسعه روش‌هایی برای دور زدن مدل‌های یادگیری ماشین هستند. با اعمال تغییرات ظریف و غیرمخرب در کد (اختلالات تقابلی)، آن‌ها می‌توانند مدل‌های طبقه‌بندی‌کننده را فریب دهند تا فکر کنند یک فایل روز صفر کاملاً ایمن است.

نتیجه‌گیری: آینده‌ای چندلایه و خودآموز

یادگیری ماشین امنیت سایبری را از یک تلاش واکنشی برای پاک‌سازی پس از وقوع فاجعه، به یک مکانیسم دفاعی پیشگیرانه در زمان واقعی تبدیل کرده است. با تحلیل رفتار، استخراج ویژگی‌های پویا و مدل‌سازی توالی‌های شبکه، یادگیری ماشین به سازمان‌ها اجازه می‌دهد تا حملات روز صفر را قبل از اینکه آسیب‌های گسترده‌ای وارد کنند، متوقف کنند.

با پیشرفته‌تر شدن مهاجمان، آینده دفاع در سیستم‌های مشترک و خودآموزی نهفته است که به طور مداوم با تهدیدات جدید سازگار می‌شوند و اطمینان حاصل می‌کنند که حتی پنهان‌ترین اکسپلویٹ‌های روز صفر نیز نمی‌توانند مخفی بمانند.

بینش‌های فنی بیشتری را در وبلاگ غزنکس کاوش کنید →