סינגולריות זירו-דיי: בתוך קלוד מיתוס ועידן ה-RCE האוטונומי

17 במאי 2026

בואו נהיה כנים. במשך זמן מה, ההייפ סביב “בינה מלאכותית באבטחת סייבר” היה מתיש. ראינו ספקים מדביקים מדבקת “מופעל על ידי בינה מלאכותית” על כלי ניתוח סטטיים סטנדרטיים מבוססי regex, וראינו “ילדי סקריפטים” משתמשים במודלי שפה גדולים מוקדמים כדי לכתוב מיילים של פישינג רועשים ושבורים להפליא.

אבל החל מאמצע 2026, הבדיחה נגמרה רשמית.

נוף האבטחה ההתקפית לא רק השתנה; הוא נשבר באופן יסודי. אנחנו כבר לא מדברים על בינה מלאכותית כ"עוזרת" שעוזרת לפנטסטר (בודק חדירות) אנושי לכתוב payload מסובך. אנחנו מתמודדים עם סוכנים אוטונומיים לחלוטין הפועלים במקביל, המסוגלים להסיק מסקנות דרך לוגיקה עסקית מורכבת, לשרשר פגיעויות ולפרוץ שרתים עוד לפני שאנליסט אנושי הספיק לסיים את כוס הקפה הראשונה שלו.

הנה מבט מהשטח על האופן שבו נראה נוף הבינה המלאכותית ההתקפית כרגע, מההסקה הכללית המפחידה של מודלי החזית ועד לדיוק החד כתער של מודלי שפה קטנים (SLMs).

1. ענק ההסקה הכללית: קלוד מיתוס (Claude Mythos)

אם אתם רוצים להבין את הפאניקה הנוכחית בקהילת האבטחה, אל תחפשו רחוק יותר מ-Claude Mythos של חברת Anthropic, ששוחרר באפריל 2026.

מיתוס לא רק עבר את מבחני ההערכה; הוא שבר את מתודולוגיית ההערכה של METR (הארגון להערכת סיכוני בינה מלאכותית). אבל מה שמדיר שינה מעיני חוקרי אבטחה הוא מה שמיתוס עשה בשטח. כשהוא פועל ללא אימון התקפי מפורש – יכולותיו צצו אך ורק מזינוקים אדירים בהסקה כללית ואוטונומיה של קוד – מיתוס גילה באופן אוטונומי אלפי פגיעויות שלא היו ידועות בעבר.

הוא לא מצא רק באגים קלים של cross-site scripting (XSS). הוא מצא פרצת אבטחה של הרצת קוד מרחוק (RCE) בת 17 שנים בשרת ה-NFS של FreeBSD ופרצת דפדפן בת 27 שנים ששרדה עשורים של ביקורת אנושית. ואז? הוא כתב אקספלויטים פונקציונליים לחלוטין עבורם ללא כל הדרכה אנושית.

זו הסיבה ש-Anthropic הגבילה את שחרורו באמצעות “Project Glasswing”, המאפשר רק לענקיות הטכנולוגיה (Apple, Microsoft, Google) להקשיח את התשתית שלהן לפני שהמודל יהיה נגיש באופן נרחב. מיתוס הוכיח קונספט מפחיד: יכולת התקפית היא כבר לא בחירה עיצובית; היא תכונה צצה של כל בינה מלאכותית חכמה מספיק.

2. המוצריזציה של האוטונומיה: XBOW ומות ה-DAST

בעוד שמיתוס מייצג את חזית האינטליגנציה הכללית, כלים כמו XBOW מייצגים את המסחור של אבטחה התקפית מונעת בינה מלאכותית.

במשך שנים, הסתמכנו על סורקי Dynamic Application Security Testing (DAST). סורקי DAST ידועים לשמצה בהיותם רועשים, איטיים וטיפשים – הם פשוט מפציצים אפליקציות ברשימות ענק של payloads סטטיים ומקווים שמשהו יתפוס. XBOW, לעומת זאת, פועל כמו “צוות אדום” (Red Team) דיגיטלי.

הנה הדרך שבה פלטפורמות כמו XBOW משנות את המשחק:

ניצול אדפטיבי (Adaptive Exploitation): XBOW לא רק שולח payload; הוא קורא את תגובת השרת. אם חומת אש של אפליקציות אינטרנט (WAF) חוסמת אותו, XBOW מנתח את החסימה ומשנה את ה-payload כדי לעקוף את ההגנה.
התקפות לוגיקה עסקית: סורקים מסורתיים אינם יכולים להבין הקשר. XBOW משתמש בבינה מלאכותית כדי לבצע בדיקות IDOR (Insecure Direct Object Reference) ו-BOLA (Broken Object Level Authorization). הוא יכול להסתכל על דף, להבין שתפקיד משתמש א’ לא אמור לראות את הנתונים של משתמש ב’, ולנצל זאת באופן אקטיבי.
שרשור פגיעויות: סורק רגיל עשוי למצוא SSRF (Server-Side Request Forgery). XBOW ימצא את ה-SSRF, יבצע פיבוט לתוך הרשת הפנימית, ישלוף מטא-דאטה של AWS וינסה להפוך את ה-SSRF הזה ל-RCE מלא.

3. הכלכלה של חוסר הסימטריה: Shell במחיר של ארוחת צהריים

אולי המחקר המשבש ביותר שיצא ב-2026 אינו עוסק באיך הבינה המלאכותית פורצת, אלא בכמה זה עולה.

היסטורית, פעילות התקפית הוגבלה על ידי כוח אדם אנושי. מבדק חדירה ידני ואיכותי של סביבת Active Directory (AD) מורכבת עולה בין 15,000 ל-50,000 דולר ולוקח שבועות.

מחקרים אחרונים על סוכני בדיקות חדירה מבוססי מודלי שפה גדולים מחקו את המודל הכלכלי הזה. בתחילת 2026, חוקרים בדקו את Excalibur (סוכן שנבנה על PentestGPT V2) מול סביבת Active Directory מציאותית. הסוכן הצליח לפרוץ לארבעה מתוך חמישה מארחים, תוך ביצוע תנועה רוחבית (lateral movement) אמיתית.

העלות? 28.50 דולר בדמי API.
המהירות? מכיוון שהסוכן לא פעל בצורה ליניארית – הוא חקר כל משטח נגיש בו-זמנית – הוא עשה עבודה של צוות שלם בשבריר מהזמן.

כאשר העלות השולית של ביצוע שרשרת התקפה מורכבת ורב-שלבית יורדת כמעט לאפס, נפח הסריקות המתוחכמות על הפרימטר החיצוני יגדל לאינסוף.

4. מהפכת ה"מודלים הקטנים" (SLMs)

בעוד שמודלי חזית כמו מיתוס תופסים את הכותרות, אבטחה ארגונית רצינית עוברת ל-Small Language Models (SLMs).

למה? כי שליחת נתוני הטלמטריה של הרשת הרגישים והקנייניים שלכם ל-API של צד שלישי היא סיוט רגולטורי. ארגונים זקוקים למודלים מקומיים (on-premises), המתמחים בצורה קיצונית ומבינים את הסביבות הספציפיות שלהם.

מחקרים מסוף 2025 ו-2026 (כמו יוזמות מערכי הנתונים SecKnowledge) הוכיחו שאין צורך במודל של טריליון פרמטרים כדי לצוד באגים. על ידי כוונון עדין (fine-tuning) של SLMs אך ורק על טקטיקות, טכניקות ונהלים של תוקפים (TTPs), payloads של אקספלויטים וקונפיגורציות רשת, חוקרים יצרו מודלים מומחים לתחום שרצים מקומית.

מודלי ה-SLM הללו מצטיינים ב:

ציד איומים מונע היפותזה: ניפוי לוגים רועשים ללא הזיות (hallucinations).
עמידה ברגולציית אחסון נתונים (Data Residency): פעולה מלאה בתוך סביבות מנותקות (air-gapped) או מוגבלות מאוד.
מהירות: יצירת payloads של fuzzing מקומיים במהירות שמודלים ענקיים לא יכולים להשתוות אליה בגלל שיהוי (latency).

המציאות עבור המגנים

כחוקר, הצפייה בתהליך הזה מתפתח היא גם מרגשת וגם מפחידה. הימים של הסתמכות על “dwell time” (זמן שהייה) נגמרו. אם סוכן בינה מלאכותית פורץ פרימטר, הוא לא צריך לישון, הוא לא לוקח סופי שבוע חופש, והוא מעבד סביבות במהירות מכונה.

ההגנה היחידה הקיימת נגד יריב אוטומטי, אדפטיבי ובעל יכולת הסקה היא הגנה אוטומטית לחלוטיن, אדפטיבית ובעלת יכולת הסקה. אנחנו נכנסים לעידן של לוחמה מרובת סוכנים, שבו ה-SLMs ההגנתיים שלכם יהיו בקרב סכינים מתמיד בזמן אמת עם סוכנים אוטונומיים התקפיים.

ניהול עדכוני אבטחה (Patch management) כבר לא מספיק. אם אסטרטגיית האבטחה שלכם לא לוקחת בחשבון יריב שיכול למצוא פרצות זירו-דיי מהר יותר ממה שאתם יכולים לקבוע פגישה, אתם כבר מאחור.

גלו תובנות טכניות נוספות בבלוג של Ghaznix ←