زیرو ڈے سنگولیرٹی: کلاڈ میتھوس کے اندر اور خود مختار RCE کا دور

17 مئی، 2026

سچ تو یہ ہے کہ کچھ عرصے تک “سائبر سیکیورٹی میں AI” کا شور کافی تھکا دینے والا تھا۔ ہم نے دیکھا کہ کمپنیوں نے عام ریجیکس (regex) پر مبنی سٹیٹک اینالیسس ٹولز پر “AI-powered” کا اسٹیکر لگا دیا، اور ہم نے دیکھا کہ نئے ہیکرز نے ابتدائی LLMs کا استعمال کرتے ہوئے انتہائی شور مچانے والی اور ناکارہ فشنگ ای میلز لکھیں۔

لیکن 2026 کے وسط تک، مذاق باضابطہ طور پر ختم ہو چکا ہے۔

جارحانہ سیکیورٹی (offensive security) کا منظر نامہ نہ صرف بدل گیا ہے بلکہ بنیادی طور پر ٹوٹ پھوٹ کا شکار ہو چکا ہے۔ اب ہم AI کو ایک ایسے “اسسٹنٹ” کے طور پر نہیں دیکھ رہے جو انسانی پینٹیسٹر (pentester) کی مدد کرے، بلکہ ہمارا واسطہ اب مکمل طور پر خود مختار اور متوازی ایجنٹوں سے ہے جو پیچیدہ کاروباری منطق کو سمجھ سکتے ہیں، کمزوریوں کو ایک دوسرے سے جوڑ سکتے ہیں، اور انسانی تجزیہ کار کے کافی پینے سے پہلے ہی سسٹم پر قبضہ کر سکتے ہیں۔

یہاں ہم 2026 کے جارحانہ AI منظر نامے کا ایک حقیقت پسندانہ جائزہ پیش کر رہے ہیں، جس میں جدید ترین ماڈلز کی خوفناک استدلال کی صلاحیتوں سے لے کر سمال لینگوئج ماڈلز (SLMs) کی باریک بینی تک سب کچھ شامل ہے۔

1. عمومی استدلال کا دیو: کلاڈ میتھوس (Claude Mythos)

اگر آپ سیکیورٹی کمیونٹی میں پھیلی موجودہ پریشانی کو سمجھنا چاہتے ہیں تو انتھروپک کے کلاڈ میتھوس پر نظر ڈالیں، جو اپریل 2026 میں ریلیز ہوا۔

میتھوس نے نہ صرف تشخیصی معیارات (benchmarks) کو عبور کیا، بلکہ اس نے METR (AI رسک اسیسمنٹ آرگنائزیشن) کے تشخیصی طریقہ کار کو ہی ناکارہ بنا دیا۔ لیکن سیکیورٹی محققین کے لیے اصل پریشانی وہ کام ہیں جو میتھوس نے حقیقی دنیا میں کیے۔ کسی بھی جارحانہ تربیت کے بغیر—صرف عمومی استدلال اور کوڈنگ میں خود مختاری کی بنیاد پر—میتھوس نے ہزاروں نامعلوم کمزوریاں (vulnerabilities) خود بخود دریافت کر لیں۔

اس نے نہ صرف عام کراس سائٹ اسکرپٹنگ (XSS) بگز تلاش کیے، بلکہ FreeBSD کے NFS سرور میں 17 سال پرانی اور براؤزر میں 27 سال پرانی ایسی کمزوریاں تلاش کیں جو دہائیوں تک انسانی نظروں سے اوجھل رہی تھیں۔ اور پھر؟ اس نے انسانی مدد کے بغیر ان کے لیے مکمل طور پر فعال ایکسپلوئٹس (exploits) لکھے۔

یہی وجہ ہے کہ انتھروپک نے “پروجیکٹ گلاس ونگ” کے ذریعے اس کی ریلیز کو محدود کر رکھا ہے، تاکہ گوگل، مائیکروسافٹ اور ایپل جیسے بڑے ادارے اپنے انفراسٹرکچر کو مضبوط بنا سکیں۔ میتھوس نے ایک خوفناک حقیقت ثابت کر دی ہے: جارحانہ صلاحیت اب کوئی انتخابی خصوصیت نہیں رہی بلکہ یہ کسی بھی ذہین AI کی ایک فطری خصوصیت بن چکی ہے۔

2. خود مختاری کی مصنوعات: XBOW اور DAST کا خاتمہ

جہاں میتھوس عمومی ذہانت کی انتہا ہے، وہیں XBOW جیسے ٹولز AI پر مبنی جارحانہ سیکیورٹی کی تجارتی شکل کو ظاہر کرتے ہیں۔

برسوں تک ہم ڈائنامک ایپلی کیشن سیکیورٹی ٹیسٹنگ (DAST) اسکینرز پر بھروسہ کرتے رہے۔ DAST اپنی سستی اور شور مچانے کی وجہ سے بدنام ہے—یہ صرف ایپلی کیشنز پر حملوں کی ایک فہرست بھیجتا ہے اور امید کرتا ہے کہ کچھ کام کر جائے۔ دوسری طرف XBOW ایک ڈیجیٹل ریڈ ٹیم (red team) کی طرح کام کرتا ہے۔

دیکھیے کس طرح XBOW جیسے پلیٹ فارمز کھیل کو بدل رہے ہیں:

موافقت پذیر استحصال (Adaptive Exploitation): XBOW صرف حملہ نہیں کرتا بلکہ وہ سرور کے جواب کو پڑھتا ہے۔ اگر ویب ایپلی کیشن فائر وال (WAF) اسے بلاک کر دے تو XBOW اس بلاک کا تجزیہ کرتا ہے اور حملے کے طریقے کو بدل دیتا ہے تاکہ رکاوٹ کو عبور کیا جا سکے۔
بزنس لاجک حملے: روایتی اسکینرز سیاق و سباق کو نہیں سمجھ سکتے۔ XBOW آئی ڈی او آر (IDOR) اور بولا (BOLA) ٹیسٹنگ کے لیے AI کا استعمال کرتا ہے۔ یہ کسی پیج کو دیکھ کر سمجھ سکتا ہے کہ یوزر A کو یوزر B کا ڈیٹا نہیں دیکھنا چاہیے اور وہ اسے ہیک کرنے کی کوشش کر سکتا ہے۔
کمزوریوں کو جوڑنا: ایک عام اسکینر شاید SSRF تلاش کر لے۔ XBOW اس SSRF کو تلاش کرے گا، اندرونی نیٹ ورک میں داخل ہوگا، کلاؤڈ میٹا ڈیٹا نکالے گا اور اسے مکمل کنٹرول حاصل کرنے کے لیے استعمال کرے گا۔

3. غیر متناسب معاشیات: لنچ کی قیمت پر سسٹم کا قبضہ

شاید 2026 کی سب سے بڑی تحقیق یہ نہیں کہ AI ہیکنگ کیسے کرتا ہے، بلکہ یہ ہے کہ اس پر خرچ کتنا آتا ہے۔

ماضی میں ہیکنگ کے لیے انسانی محنت درکار ہوتی تھی۔ ایک پیچیدہ نیٹ ورک کا معیاری مینوئل پینٹیسٹ 15,000 سے 50,000 ڈالر تک مہنگا ہو سکتا تھا اور اس میں ہفتوں لگتے تھے۔

AI پر مبنی پینٹیسٹنگ ایجنٹوں نے اس معاشی ماڈل کو تباہ کر دیا ہے۔ 2026 کے اوائل میں محققین نے Excalibur نامی ایجنٹ کا تجربہ کیا، جس نے ایک پیچیدہ نیٹ ورک کو کامیابی سے ہیک کیا۔

خرچ کتنا ہوا؟ صرف 28.50 ڈالر (API فیس)۔
رفتار کیا تھی؟ چونکہ ایجنٹ نے ایک وقت میں ہر ممکنہ راستے کو آزمایا، اس لیے اس نے ایک ٹیم کا کام اس کے صرف ایک معمولی حصے کے برابر وقت میں مکمل کر لیا۔

جب ایک پیچیدہ حملے کی لاگت تقریباً ختم ہو جائے گی، تو بیرونی نیٹ ورکس پر حملوں کی تعداد لامحدود حد تک بڑھ جائے گی۔

4. “سمال ماڈل” انقلاب (SLMs)

جہاں میتھوس جیسے بڑے ماڈلز سرخیوں میں رہتے ہیں، وہیں بڑی کمپنیاں اب سمال لینگوئج ماڈلز (SLMs) کی طرف بڑھ رہی ہیں۔

کیوں؟ کیونکہ اپنے حساس نیٹ ورک کا ڈیٹا کسی تیسرے فریق کی API کو بھیجنا سیکیورٹی کے لحاظ سے خطرناک ہے۔ کمپنیوں کو ایسے ماڈلز کی ضرورت ہے جو ان کے اپنے سرورز پر چلیں اور ان کے مخصوص ماحول کو سمجھیں۔

2025 اور 2026 کی تحقیق نے ثابت کیا ہے کہ بگز تلاش کرنے کے لیے آپ کو کھربوں پیرامیٹرز والے ماڈل کی ضرورت نہیں ہے۔ محققین نے ایسے ماہر ماڈلز بنائے ہیں جو صرف ہیکرز کے طریقوں اور نیٹ ورک کنفیگریشنز پر تربیت یافتہ ہیں اور مقامی طور پر چلتے ہیں۔

یہ SLMs درج ذیل کاموں میں بہترین ہیں:

خطروں کی تلاش: بغیر کسی غلط فہمی (hallucinations) کے شور والے لاگز کا تجزیہ کرنا۔
ڈیٹا سیکیورٹی: مکمل طور پر محفوظ اور نجی ماحول میں کام کرنا۔
رفتار: بہت تیزی سے حملے کے طریقے تیار کرنا جو بڑے ماڈلز تاخیر کی وجہ سے نہیں کر پاتے۔

دفاع کرنے والوں کے لیے حقیقت

ایک محقق کے طور پر، اس سب کو دیکھنا پرجوش بھی ہے اور خوفناک بھی۔ اب وہ دن گئے جب ہم یہ سوچ کر خوش ہوتے تھے کہ ہیکر کو پکڑے جانے میں وقت لگے گا۔ اگر کوئی AI ایجنٹ حملہ کرتا ہے تو اسے سونے کی ضرورت نہیں، وہ چھٹی نہیں لیتا اور وہ مشین کی رفتار سے کام کرتا ہے۔

ایک خودکار اور ذہین دشمن کے خلاف واحد حل ایک مکمل طور پر خودکار اور ذہین دفاعی نظام ہے۔ ہم ایک ایسے دور میں داخل ہو رہے ہیں جہاں آپ کے دفاعی ایجنٹس ہر وقت جارحانہ ایجنٹوں کے ساتھ برسرِ پیکار ہوں گے۔

صرف سسٹم اپ ڈیٹ کرنا اب کافی نہیں رہا۔ اگر آپ کی حکمت عملی ایسے دشمن کا مقابلہ کرنے کے لیے تیار نہیں ہے جو آپ کی میٹنگ طے کرنے سے پہلے ہی زیرو ڈے ڈھونڈ سکتا ہے، تو آپ پہلے ہی ہار چکے ہیں۔

غزنکس بلاگ پر مزید تکنیکی معلومات حاصل کریں ←