मशीन लर्निंग जीरो-डे हमलों का पता कैसे लगाती है

22 मई 2026

मशीन लर्निंग एल्गोरिदम साइबर खतरे के डैशबोर्ड पर जीरो-डे भेद्यता शोषण का पता लगाकर उसे रोक रहे हैं

दशकों से, साइबर सुरक्षा हस्ताक्षरों (signatures) पर आधारित बिल्ली-और-चूहे का खेल रही है। जब किसी नए मैलवेयर या एक्सप्लोइट का पता चलता था, तो सुरक्षा शोधकर्ता उसका विश्लेषण करते थे, एक अद्वितीय डिजिटल हस्ताक्षर निकालते थे, और उसे एंटीवायरस डेटाबेस में वितरित करते थे।

लेकिन हस्ताक्षर-आधारित रक्षा में एक घातक खामी है: यह पूरी तरह से प्रतिक्रियाशील है। यह उस चीज़ को नहीं रोक सकती जिसे उसने पहले कभी नहीं देखा है।

यहाँ प्रवेश होता है जीरो-डे हमले (Zero-Day Attack) का—एक ऐसा हमला जो विक्रेता द्वारा पैच जारी करने से पहले एक अज्ञात सॉफ्टवेयर भेद्यता को लक्षित करता है। चूंकि कोई हस्ताक्षर उपलब्ध नहीं होते हैं, पारंपरिक फ़ायरवॉल और घुसप्रेठ रोकथाम प्रणालियाँ (IPS) इनके प्रति पूरी तरह से अंधी रहती हैं।

जीरो-डे खतरों से बचाव के लिए, उद्योग एक बड़े बदलाव से गुजर रहा है: हस्ताक्षरों से हटकर मशीन लर्निंग (ML) द्वारा संचालित व्यवहार विश्लेषण की ओर बढ़ना।

1. हस्ताक्षरों से परे: विसंगति का पता लगाने की प्रक्रिया

मशीन लर्निंग-आधारित सुरक्षा के केंद्र में विसंगति का पता लगाना (Anomaly Detection) है। ज्ञात खराब व्यवहार (हस्ताक्षरों) की खोज करने के बजाय, एमएल मॉडल को यह समझने के लिए प्रशिक्षित किया जाता है कि एक सिस्टम या नेटवर्क में “सामान्य” व्यवहार कैसा दिखता है, और उस आधार रेखा (baseline) से विचलित होने वाली किसी भी चीज़ को चिह्नित किया जाता है।

व्यवहार संबंधी आधार रेखा का निर्माण: आइसोलेशन फॉरेस्ट और ऑटोएनकोडर जैसे अनसुपरवाइज्ड लर्निंग एल्गोरिदम सामान्य संचालन का एक अत्यधिक विस्तृत मॉडल बनाने के लिए नेटवर्क ट्रैफ़िक, उपयोगकर्ता गतिविधियों और सिस्टम लॉग के विशाल डेटा को विश्लेषित करते हैं।
विचलन स्कोरिंग: जब कोई जीरो-डे एक्सप्लोइट निष्पादित होता है, तो यह अनिवार्य रूप से ऐसी क्रियाएं करता है जो आधार रेखा से विचलित होती हैं—जैसे कि एपीआई कॉल का एक असामान्य अनुक्रम चलाना, अप्रत्याशित पोर्ट कनेक्शन खोलना, या प्रतिबंधित सिस्टम मेमोरी को पढ़ने का प्रयास करना। एमएल मॉडल तुरंत इस व्यवहार को एक उच्च विसंगति स्कोर के साथ चिह्नित करता है।

2. गतिशील विशेषता निष्कर्षण: वास्तविक समय में फ़ाइलों का विश्लेषण

जीरो-डे हमले अक्सर ईमेल अटैचमेंट या ड्राइव-बाय डाउनलोड के माध्यम से आते हैं। चूंकि हस्ताक्षर चेकर्स इन नई फ़ाइलों को चिह्नित नहीं कर सकते हैं, इसलिए एमएल-संचालित एंडपॉइंट मिलीसेकंड में उनका विश्लेषण करने के लिए स्थैतिक (static) और गतिशील (dynamic) विशेषता निष्कर्षण का उपयोग करते हैं।

स्थैतिक विश्लेषण: मॉडल फ़ाइल को चलाए बिना उसके ढांचे, आयातित DLL, एपीआई फ़ंक्शन कॉल और मेटाडेटा का विश्लेषण करता है। डीप लर्निंग मॉडल दुर्भावनापूर्ण पैटर्न को तब भी चिह्नित कर सकते हैं जब कोड को छुपाया (obfuscate) गया हो।
गतिशील सैंडबॉक्स विश्लेषण: यदि स्थैतिक विश्लेषण अनिर्णायक है, तो फ़ाइल को एक सुरक्षित, वर्चुअलाइज्ड सैंडबॉक्स वातावरण में चलाया जाता है। एमएल एजेंट इसके वास्तविक निष्पादन की निगरानी करता है और निम्नलिखित व्यवहारों को ट्रैक करता है:
- प्रोसेस इंजेक्शन: वैध सिस्टम प्रक्रियाओं (जैसे explorer.exe) में कोड इंजेक्ट करने का प्रयास।
- रजिस्ट्री संशोधन: संवेदनशील स्टार्टअप कुंजियों में लिखना या सुरक्षा सेवाओं को अक्षम करना।
- विशेषाधिकार बढ़ाना: सिस्टम एक्सप्लोइट के माध्यम से असामान्य रूप से एडमिनिस्ट्रेटर एक्सेस का अनुरोध करना।

3. नेटवर्क ट्रैफ़िक विश्लेषण और अनुक्रमिक मॉडलिंग

कई जीरो-डे हमलों में रिमोट कमांड निष्पादन, डेटा चोरी, या नेटवर्क में एक सिस्टम से दूसरे सिस्टम में जाने का प्रयास (Lateral Movement) शामिल होता है। मशीन लर्निंग नेटवर्क टेलीमेट्री को घटनाओं के एक अनुक्रम के रूप में मानकर इन गतिविधियों की निगरानी करती है।

LSTM और आवर्ती न्यूरल नेटवर्क (RNN): जैसे प्राकृतिक भाषा प्रसंस्करण (NLP) में वाक्य के अगले शब्द की भविष्यवाणी करने के लिए LSTM का उपयोग किया जाता है, वैसे ही सुरक्षा में नेटवर्क प्रवाह को मॉडल करने के लिए इनका उपयोग किया जाता है। मॉडल उपकरणों के बीच संचार के विशिष्ट अनुक्रम को सीखता है और दुर्भावनापूर्ण विसंगतियों को चिह्नित करता है।
ग्राफ न्यूरल नेटवर्क (GNN): GNN पूरे नेटवर्क टोपोलॉजी को एक ग्राफ के रूप में मैप करते हैं, जहाँ डिवाइस नोड्स होते हैं और संचार उनके बीच की कड़ियाँ होती हैं। यह मॉडल को छिपी हुई गतिविधियों का पता लगाने की अनुमति देता है जहाँ एक हमलावर जीरो-डे एक्सप्लोइट का उपयोग करके एक सर्वर से दूसरे सर्वर पर जाने का प्रयास कर रहा होता है।

4. चुनौतियाँ: एमएल रक्षा की दोधारी तलवार

यद्यपि मशीन लर्निंग अविश्वसनीय रूप से शक्तिशाली है, लेकिन यह कोई जादुई छड़ी नहीं है। एमएल के साथ प्रणालियों को सुरक्षित करना अपनी खुद की इंजीनियरिंग चुनौतियों के साथ आता है:

गलत विसंगति (False Positive) की दुविधा: यदि विसंगति का पता लगाने वाला मॉडल बहुत संवेदनशील है, तो यह वैध सॉफ़्टवेयर अपडेट या प्रशासनिक कार्यों को हमलों के रूप में चिह्नित करेगा, जिससे सुरक्षा टीमों में अलर्ट थकान (alert fatigue) पैदा होगी।
प्रतिकूल मशीन लर्निंग (Adversarial ML): साइबर अपराधी एमएल मॉडल को बायपास करने के तरीके सक्रिय रूप से विकसित कर रहे हैं। कोड में सूक्ष्म, गैर-दुर्भावनापूर्ण संशोधन करके, वे क्लासिफायर मॉडल को यह सोचने के लिए धोखा दे सकते हैं कि जीरो-डे पेलोड पूरी तरह से सुरक्षित है।

निष्कर्ष: एक बहु-स्तरीकृत, स्व-शिक्षण भविष्य

मशीन लर्निंग ने साइबर सुरक्षा को एक प्रतिक्रियाशील दृष्टिकोण से बदलकर एक सक्रिय, वास्तविक समय की सुरक्षा प्रणाली में बदल दिया है। व्यवहार का विश्लेषण करके, गतिशील विशेषताओं को निकालकर और नेटवर्क अनुक्रमों को मॉडल करके, एमएल संगठनों को व्यापक नुकसान होने से पहले जीरो-डे हमलों को रोकने में सक्षम बनाता है।

जैसे-जैसे हमलावर अधिक परिष्कृत होते जा रहे हैं, रक्षा का भविष्य सहयोगी, स्व-शिक्षण प्रणालियों में निहित है जो लगातार नए खतरों के अनुकूल होती हैं, यह सुनिश्चित करते हुए कि सबसे गुप्त जीरो-डे हमले भी छिपे न रह सकें।

ग़ज़निक्स ब्लॉग पर अधिक तकनीकी अंतर्दृष्टि प्राप्त करें →