سينجولاريتي اليوم الصفر: داخل كلود ميثوس وعصر الثغرات البرمجية المستقلة (RCE)

17 مايو 2026

لنكن صادقين. لفترة من الوقت، كان الحديث حول “الذكاء الاصطناعي في الأمن السيبراني” مرهقاً. شاهدنا الشركات تضع ملصق “مدعوم بالذكاء الاصطناعي” على أدوات التحليل الثابتة القياسية التي تعتمد على التعبيرات النمطية (regex)، وشاهدنا صغار الهواة يستخدمون النماذج اللغوية الكبيرة المبكرة لكتابة رسائل بريد إلكتروني للتصيد الاحتيالي مليئة بالأخطاء.

ولكن اعتباراً من منتصف عام 2026، انتهى وقت المزاح رسمياً.

لم يتغير مشهد الأمن الهجومي فحسب؛ بل انكسر بشكل جذري. لم نعد نتحدث عن الذكاء الاصطناعي كـ “مساعد” يساعد المخترق البشري في كتابة حمولة ضارة معقدة. نحن نتعامل مع وكلاء مستقلين تماماً، يعملون بالتوازي، ويمكنهم التفكير في منطق الأعمال المعقد، وربط الثغرات، والوصول إلى الأنظمة قبل أن ينتهي المحلل البشري من شرب فنجان قهوته الأول.

إليك نظرة من الميدان على شكل مشهد الذكاء الاصطناعي الهجومي في الوقت الحالي، من التفكير العام المرعب لنماذج الطليعة إلى الدقة المتناهية للنماذج اللغوية الصغيرة (SLMs).

1. عملاق التفكير العام: كلود ميثوس (Claude Mythos)

إذا كنت تريد فهم حالة الذعر الحالية في مجتمع الأمن، فلا تنظر إلى أبعد من كلود ميثوس من شركة Anthropic، الذي تم إصداره في أبريل 2026.

لم ينجح ميثوس في اجتياز معايير التقييم فحسب؛ بل حطم منهجية التقييم الخاصة بمنظمة METR (منظمة تقييم مخاطر الذكاء الاصطناعي). ولكن ما يقلق الباحثين الأمنيين هو ما فعله ميثوس في الواقع. فمن خلال العمل دون تدريب هجومي صريح - حيث ظهرت قدراته فقط من القفزات الهائلة في التفكير العام واستقلالية البرمجة - اكتشف ميثوس بشكل مستقل آلاف الثغرات التي لم تكن معروفة من قبل.

لم يجد ميثوس ثغرات بسيطة مثل البرمجة عبر المواقع (XSS) فحسب. بل وجد ثغرة تنفيذ التعليمات البرمجية عن بعد (RCE) عمرها 17 عاماً في خادم FreeBSD NFS، وثغرة في المتصفح عمرها 27 عاماً نجت من عقود من المراجعة البشرية. وماذا بعد ذلك؟ كتب استغلالاً كاملاً لها دون أي توجيه بشري.

هذا هو السبب في أن Anthropic قيدت إصداره عبر “Project Glasswing”، مما يسمح فقط لعمالقة التكنولوجيا (Apple، Microsoft، Google) بتقوية بنيتها التحتية قبل أن يصبح النموذج متاحاً على نطاق واسع. أثبت ميثوس مفهوماً مرعباً: القدرة الهجومية لم تعد خياراً في التصميم؛ بل هي خاصية ناشئة لأي ذكاء اصطناعي ذكي بما فيه الكفاية.

2. تسليع الاستقلالية: XBOW ونهاية أدوات DAST

بينما يمثل ميثوس طليعة الذكاء العام، تمثل أدوات مثل XBOW تسويق الأمن الهجومي المدفوع بالذكاء الاصطناعي.

لسنوات، اعتمدنا على ماسحات اختبار أمن التطبيقات الديناميكية (DAST). تُعرف DAST بأنها مزعجة وبطيئة وغبية - فهي تقوم فقط بقصف التطبيقات بقوائم ضخمة من الحمولات الثابتة وتأمل أن ينجح شيء ما. أما XBOW، من ناحية أخرى، فيعمل كفريق أحمر رقمي.

إليك كيف تغير منصات مثل XBOW قواعد اللعبة:

الاستغلال التكيفي: لا يرسل XBOW حمولة فحسب؛ بل يقرأ استجابة الخادم. إذا قام جدار حماية تطبيقات الويب (WAF) بحظره، يقوم XBOW بتحليل الحظر وتعديل الحمولة لتجاوز الدفاعات.
هجمات منطق الأعمال: لا تستطيع الماسحات التقليدية فهم السياق. يستخدم XBOW الذكاء الاصطناعي لإجراء اختبارات IDOR (مرجع الكائن المباشر غير الآمن) و BOLA (تفويض مستوى الكائن المكسور). يمكنه النظر في الصفحة، وفهم أن دور المستخدم “أ” لا ينبغي أن يرى بيانات المستخدم “ب”، واستغلال ذلك بنشاط.
ربط الثغرات: قد يجد الماسح التقليدي ثغرة SSRF (تزوير الطلب من جانب الخادم). سيقوم XBOW بالعثور على SSRF، والانتقال إلى الشبكة الداخلية، واستخراج بيانات AWS الوصفية، ومحاولة تحويل SSRF إلى RCE كامل.

3. اقتصاديات عدم التماثل: اختراق بسعر وجبة غداء

ربما تكون الأبحاث الأكثر إثارة للقلق في عام 2026 ليست حول كيفية اختراق الذكاء الاصطناعي، بل حول التكلفة.

تاريخياً، كان النشاط الهجومي مقيداً بالعمالة البشرية. يكلف اختبار الاختراق اليدوي عالي الجودة لبيئة Active Directory (AD) معقدة ما بين 15,000 إلى 50,000 دولار ويستغرق أسابيع.

أدت الأبحاث الأخيرة حول وكلاء اختبار الاختراق القائمين على النماذج اللغوية الكبيرة إلى تحطيم هذا النموذج الاقتصادي. في أوائل عام 2026، قام الباحثون بتقييم Excalibur (وهو وكيل مبني على PentestGPT V2) مقابل بيئة Active Directory واقعية. نجح الوكيل في اختراق أربعة من أصل خمسة أجهزة، منفذاً تحركات جانبية حقيقية.

التكلفة؟ 28.50 دولاراً كرسوم لواجهة برمجة التطبيقات (API).
السرعة؟ لأن الوكيل لم يعمل بشكل خطي - بل استكشف كل سطح يمكن الوصول إليه في وقت واحد - فقد أنجز عمل فريق كامل في جزء بسيط من الوقت.

عندما تنخفض التكلفة الهامشية لتنفيذ سلسلة هجمات معقدة ومتعددة المراحل إلى الصفر تقريباً، فإن حجم الاستطلاع المتطور على المحيط الخارجي سيتوسع بشكل لا نهائي.

4. ثورة “النماذج الصغيرة” (SLMs)

بينما تتصدر نماذج الطليعة مثل ميثوس العناوين الرئيسية، ينتقل أمن المؤسسات الجاد نحو النماذج اللغوية الصغيرة (SLMs).

لماذا؟ لأن إرسال بيانات شبكتك الحساسة والخاصة إلى واجهة برمجة تطبيقات خارجية هو كابوس للامتثال. تحتاج المؤسسات إلى نماذج محلية متخصصة للغاية تفهم بيئاتها المحددة.

أثبتت الأبحاث في أواخر عام 2025 وعام 2026 (مثل مبادرات مجموعة بيانات SecKnowledge) أنك لست بحاجة إلى نموذج بمليار معلمة لاصطياد الأخطاء. من خلال ضبط النماذج الصغيرة حصرياً على تكتيكات وتقنيات وإجراءات المهاجمين (TTPs)، وحمولات الاستغلال، وتكوينات الشبكة، أنشأ الباحثون نماذج خبراء في المجال تعمل محلياً.

تتفوق هذه النماذج الصغيرة في:

البحث عن التهديدات القائم على الفرضيات: غربلة السجلات المزعجة دون هلوسة.
الامتثال لإقامة البيانات: العمل بالكامل داخل بيئات معزولة أو مقيدة للغاية.
السرعة: إنشاء حمولات اختبار عشوائي (fuzzing) محلية بسرعة لا يمكن للنماذج الضخمة مطابقتها بسبب التأخير.

الواقع بالنسبة للمدافعين

كباحث، فإن مشاهدة هذا يتكشف أمر مثير ومرعب في نفس الوقت. لقد انتهت أيام الاعتماد على “وقت المكوث”. إذا اخترق وكيل ذكاء اصطناعي محيطاً أمنياً، فهو لا يحتاج إلى النوم، ولا يأخذ عطلات نهاية الأسبوع، ويعالج البيئات بسرعة الآلة.

الدفاع الوحيد القابل للتطبيق ضد خصم مؤتمت ومتكيف وقادر على التفكير هو دفاع مؤتمت ومتكيف وقادر على التفكير تماماً. نحن ندخل عصراً من حرب الوكلاء المتعددين، حيث ستكون نماذجك الصغيرة الدفاعية في معركة حقيقية ومستمرة مع الوكلاء المستقلين الهجوميين.

لم تعد إدارة الثغرات كافية. إذا كانت استراتيجيتك الأمنية لا تأخذ في الحسبان خصماً يمكنه العثور على ثغرات يوم الصفر أسرع مما يمكنك تحديد موعد لاجتماع، فأنت متأخر بالفعل.