जीरो-डे सिंगुलैरिटी: क्लॉड मिथोस के अंदर और स्वायत्त RCE का युग

17 मई 2026

सच कहें तो, कुछ समय के लिए “साइबर सुरक्षा में AI” का शोर काफी थका देने वाला था। हमने वेंडर्स को मानक रिगेक्स-आधारित (regex-based) स्टेटिक विश्लेषण टूल्स पर “AI-पावर्ड” स्टिकर चिपकाते देखा, और हमने शुरुआती LLMs का उपयोग करके नौसिखिए हैकर्स को बेहद शोर भरे और टूटे-फूटे फ़िशिंग ईमेल लिखते देखा।

लेकिन 2026 के मध्य तक, यह मजाक आधिकारिक तौर पर खत्म हो चुका है।

आक्रामक सुरक्षा (offensive security) का परिदृश्य न केवल बदल गया है; यह मौलिक रूप से टूट गया है। हम अब AI को एक “सहायक” के रूप में नहीं देख रहे हैं जो एक मानव पेंटेस्टर को कठिन पेलोड लिखने में मदद करता है। हम पूरी तरह से स्वायत्त, समानांतर एजेंटों के साथ काम कर रहे हैं जो जटिल व्यावसायिक तर्क के माध्यम से सोच सकते हैं, कमजोरियों को जोड़ सकते हैं, और मानव विश्लेषक के अपनी पहली कॉफी खत्म करने से पहले ही सिस्टम पर कब्जा कर सकते हैं।

यहाँ वर्तमान आक्रामक AI परिदृश्य का एक नज़रिया है, जिसमें अग्रणी मॉडलों की भयानक तर्क क्षमताओं से लेकर स्मॉल लैंग्वेज मॉडल्स (SLMs) की सूक्ष्म सटीकता तक सब कुछ शामिल है।

1. सामान्य तर्क का दिग्गज: क्लॉड मिथोस (Claude Mythos)

यदि आप सुरक्षा समुदाय में वर्तमान घबराहट को समझना चाहते हैं, तो एंथ्रोपिक के क्लॉड मिथोस को देखें, जिसे अप्रैल 2026 में जारी किया गया था।

मिथोस ने न केवल मूल्यांकन मानकों को पार किया; इसने METR (AI जोखिम मूल्यांकन संगठन) की मूल्यांकन पद्धति को ही ध्वस्त कर दिया। लेकिन सुरक्षा शोधकर्ताओं को जो बात रात भर जगाए रखती है, वह यह है कि मिथोस ने वास्तविक दुनिया में क्या किया। बिना किसी स्पष्ट आक्रामक प्रशिक्षण के—इसकी क्षमताएं विशुद्ध रूप से सामान्य तर्क और कोडिंग स्वायत्तता में भारी उछाल से उभरीं—मिथोस ने स्वायत्त रूप से हजारों अज्ञात कमजोरियों की खोज की।

इसने न केवल साधारण क्रॉस-साइट स्क्रिप्टिंग (XSS) बग्स खोजे। इसने FreeBSD के NFS सर्वर में 17 साल पुराने रिमोट कोड निष्पादन (RCE) दोष और 27 साल पुराने ब्राउज़र दोष को खोजा जो दशकों की मानव समीक्षा के बाद भी बचा रहा था। और फिर? उसने बिना किसी मानव मार्गदर्शन के उनके लिए पूरी तरह से कार्यात्मक कारनामे (exploits) लिखे।

यही कारण है कि एंथ्रोपिक ने “प्रोजेक्ट ग्लास विंग” के माध्यम से इसकी रिलीज़ को सीमित कर दिया है, जिससे केवल तकनीकी दिग्गजों (एप्पल, माइक्रोसॉफ्ट, गूगल) को मॉडल के व्यापक रूप से सुलभ होने से पहले अपने बुनियादी ढांचे को मजबूत करने की अनुमति मिली है। मिथोस ने एक भयानक अवधारणा साबित की: आक्रामक क्षमता अब एक डिजाइन विकल्प नहीं है; यह किसी भी पर्याप्त स्मार्ट AI की एक उभरती हुई विशेषता है।

2. स्वायत्तता का उत्पाद: XBOW और DAST का अंत

जहाँ मिथोस सामान्य बुद्धिमत्ता की सीमा का प्रतिनिधित्व करता है, वहीं XBOW जैसे उपकरण AI- संचालित आक्रामक सुरक्षा के व्यावसायीकरण का प्रतिनिधित्व करते हैं।

वर्षों तक, हम डायनेमिक एप्लिकेशन सुरक्षा परीक्षण (DAST) स्कैनर्स पर निर्भर रहे। DAST अपनी धीमी गति और शोर के लिए कुख्यात है—यह केवल अनुप्रयोगों पर स्थिर पेलोड की विशाल सूचियों की बमबारी करता है और उम्मीद करता है कि कुछ काम कर जाए। दूसरी ओर, XBOW एक डिजिटल रेड टीम की तरह काम करता है।

यहाँ बताया गया है कि XBOW जैसे प्लेटफॉर्म खेल को कैसे बदल रहे हैं:

अनुकूली शोषण (Adaptive Exploitation): XBOW केवल पेलोड नहीं भेजता; यह सर्वर की प्रतिक्रिया को पढ़ता है। यदि कोई वेब एप्लिकेशन फायरवॉल (WAF) इसे ब्लॉक करता है, तो XBOW ब्लॉक का विश्लेषण करता है और सुरक्षा घेरे को बायपास करने के लिए पेलोड को बदल देता है।
बिजनेस लॉजिक हमले: पारंपरिक स्कैनर संदर्भ (context) को नहीं समझ सकते। XBOW IDOR (Insecure Direct Object Reference) और BOLA (Broken Object Level Authorization) परीक्षण करने के लिए AI का उपयोग करता है। यह एक पेज को देख सकता है, समझ सकता है कि उपयोगकर्ता भूमिका A को उपयोगकर्ता B का डेटा नहीं देखना चाहिए, और सक्रिय रूप से इसका फायदा उठा सकता है।
कमजोरियों को जोड़ना: एक स्कैनर शायद एक SSRF (Server-Side Request Forgery) ढूंढ ले। XBOW उस SSRF को ढूंढेगा, आंतरिक नेटवर्क में प्रवेश करेगा, AWS मेटाडेटा निकालेगा और उस SSRF को पूर्ण RCE में बदलने का प्रयास करेगा।

3. विषमता की अर्थव्यवस्था: दोपहर के भोजन की कीमत पर सिस्टम एक्सेस

शायद 2026 में सामने आने वाला सबसे विघटनकारी शोध यह नहीं है कि AI कैसे हैक करता है, बल्कि यह है कि इसमें कितना खर्च आता है।

ऐतिहासिक रूप से, आक्रामक गतिविधि मानव श्रम द्वारा सीमित थी। एक जटिल सक्रिय निर्देशिका (AD) वातावरण के उच्च-गुणवत्ता वाले, मैन्युअल पैठ परीक्षण (penetration test) की लागत $15,000 से $50,000 के बीच होती है और इसमें हफ्तों लगते हैं।

LLM-आधारित पैठ परीक्षण एजेंटों पर हालिया शोध ने इस आर्थिक मॉडल को नष्ट कर दिया है। 2026 की शुरुआत में, शोधकर्ताओं ने एक वास्तविक सक्रिय निर्देशिका वातावरण के खिलाफ Excalibur (PentestGPT V2 पर निर्मित एक एजेंट) का परीक्षण किया। एजेंट ने पांच में से चार होस्ट के साथ सफलतापूर्वक समझौता किया, वास्तविक लेटरल मूवमेंट को अंजाम दिया।

लागत? API शुल्क में केवल $28.50।
गति? क्योंकि एजेंट ने रैखिक रूप से काम नहीं किया—उसने हर सुलभ सतह को एक साथ खोजा—उसने एक टीम का काम बहुत कम समय में पूरा कर लिया।

जब एक जटिल, बहु-चरणीय हमले की श्रृंखला को निष्पादित करने की सीमांत लागत लगभग शून्य हो जाती है, तो बाहरी परिधि पर परिष्कृत जांच की मात्रा असीमित रूप से बढ़ जाएगी।

4. “स्मॉल मॉडल” क्रांति (SLMs)

जहाँ मिथोस जैसे दिग्गज मॉडल सुर्खियां बटोरते हैं, वहीं गंभीर उद्यम सुरक्षा स्मॉल लैंग्वेज मॉडल्स (SLMs) की ओर बढ़ रही है।

क्यों? क्योंकि आपके अत्यंत संवेदनशील, मालिकाना नेटवर्क टेलीमेट्री डेटा को तीसरे पक्ष के API पर भेजना अनुपालन (compliance) के लिए एक दुःस्वप्न है। उद्यमों को ऑन-प्रिमाइसेस, उच्च-विशिष्ट मॉडलों की आवश्यकता होती है जो उनके विशिष्ट वातावरण को समझते हों।

2025 के अंत और 2026 के शोध (जैसे SecKnowledge डेटासेट पहल) ने साबित कर दिया कि बग्स खोजने के लिए आपको ट्रिलियन-पैरामीटर मॉडल की आवश्यकता नहीं है। शोधकर्ताओं ने हमलावर युक्तियों, तकनीकों और प्रक्रियाओं (TTPs), शोषण पेलोड और नेटवर्क कॉन्फ़िगरेशन पर विशेष रूप से SLMs को ट्यून करके विशेषज्ञ मॉडल बनाए हैं जो स्थानीय रूप से चलते हैं।

ये SLMs निम्नलिखित में उत्कृष्ट हैं:

परिकल्पना-संचालित थ्रेट हंटिंग: बिना किसी मतिभ्रम (hallucinations) के शोर भरे लॉग्स की छानबीन करना।
डेटा निवास अनुपालन (Data Residency): पूरी तरह से एयर-गैप्ड या अत्यधिक प्रतिबंधित वातावरण के भीतर काम करना।
गति: उस गति से स्थानीयकृत फ़ज़िंग पेलोड उत्पन्न करना जो विशाल मॉडल विलंबता (latency) के कारण नहीं कर सकते।

रक्षकों के लिए वास्तविकता

एक शोधकर्ता के रूप में, इसे होते देखना रोमांचक और डरावना दोनों है। “ड्वेल टाइम” पर भरोसा करने के दिन खत्म हो गए हैं। यदि कोई AI एजेंट सुरक्षा घेरा तोड़ता है, तो उसे सोने की ज़रूरत नहीं है, वह सप्ताहांत की छुट्टी नहीं लेता है, और वह मशीन की गति से वातावरण को प्रोसेस करता है।

एक स्वचालित, अनुकूली और तर्क करने वाले दुश्मन के खिलाफ एकमात्र व्यवहार्य रक्षा पूरी तरह से स्वचालित, अनुकूली और तर्क करने वाली रक्षा है। हम मल्टी-एजेंट युद्ध के युग में प्रवेश कर रहे हैं, जहाँ आपके रक्षात्मक SLMs आक्रामक स्वायत्त एजेंटों के साथ निरंतर, वास्तविक समय की लड़ाई में होंगे।

पैच प्रबंधन अब पर्याप्त नहीं है। यदि आपकी सुरक्षा रणनीति उस दुश्मन को ध्यान में नहीं रखती है जो आपके मीटिंग शेड्यूल करने से पहले जीरो-डे ढूंढ सकता है, तो आप पहले से ही पीछे हैं।

ग़ज़्निक्स ब्लॉग पर अधिक तकनीकी जानकारी प्राप्त करें ←