Sıfırıncı Gün Tekilliği: Claude Mythos ve Otonom RCE Çağı

17 Mayıs 2026

Dürüst olalım. Bir süredir “siber güvenlikte yapay zeka” tantanası yorucuydu. Tedarikçilerin standart regex tabanlı statik analiz araçlarına “yapay zeka destekli” etiketi yapıştırmasını ve acemi hakerların (script kiddies) inanılmaz derecede gürültülü, bozuk oltalama e-postaları yazmak için ilk dil modellerini kullanmasını izledik.

Ancak 2026’nın ortası itibarıyla bu şaka resmen sona erdi.

Ofansif güvenlik manzarası sadece değişmekle kalmadı; temelden parçalandı. Artık yapay zekayı bir insan sızma testi uzmanına karmaşık bir yük (payload) yazmasında yardımcı olan bir “asistan” olarak konuşmuyoruz. Karmaşık iş mantığı üzerinden akıl yürütebilen, zafiyetleri birbirine bağlayabilen ve bir insan analist ilk kahvesini bitirmeden sistemleri ele geçirebilen tamamen otonom, paralelleştirilmiş ajanlarla uğraşıyoruz.

Öncü modellerin korkutucu genel akıl yürütme becerilerinden Küçük Dil Modellerinin (SLM) jilet keskinliğindeki hassasiyetine kadar, ofansif yapay zeka manzarasının şu anki gerçekliğine cepheden bir bakış:

1. Genel Akıl Yürütme Devi: Claude Mythos

Güvenlik topluluğundaki mevcut paniği anlamak istiyorsanız, Anthropic’in Nisan 2026’da yayınladığı Claude Mythos’tan başkasına bakmanıza gerek yok.

Mythos sadece değerlendirme kriterlerini geçmekle kalmadı; METR (yapay zeka risk değerlendirme kuruluşu) değerlendirme metodolojisini yerle bir etti. Ancak güvenlik araştırmacılarını asıl uykusuz bırakan şey, Mythos’un gerçek dünyada yaptıklarıydı. Açık bir ofansif eğitim almadan —yetenekleri tamamen genel akıl yürütme ve kodlama otonomisindeki devasa sıçramalardan ortaya çıktı— Mythos otonom olarak binlerce daha önce bilinmeyen zafiyet keşfetti.

Sadece kolay siteler arası betik çalıştırma (XSS) hatalarını bulmakla kalmadı. FreeBSD’nin NFS sunucusunda 17 yıllık bir uzaktan kod yürütme (RCE) açığı ve onlarca yıllık insan incelemesinden sağ çıkmış 27 yıllık bir tarayıcı hatası buldu. Peki ya sonra? İnsan rehberliği olmadan onlar için tamamen işlevsel istismar (exploit) kodları yazdı.

İşte bu yüzden Anthropic, model yaygın olarak erişilebilir hale gelmeden önce teknoloji devlerinin (Apple, Microsoft, Google) altyapılarını sertleştirmelerine izin vermek için “Project Glasswing” aracılığıyla sürümünü kısıtladı. Mythos korkutucu bir kavramı kanıtladı: Ofansif yetenek artık bir tasarım seçimi değil; yeterince akıllı herhangi bir yapay zekanın ortaya çıkan doğal bir özelliğidir.

2. Otonominin Ürünleşmesi: XBOW ve DAST’ın Ölümü

Mythos genel zekanın öncüsünü temsil ederken, XBOW gibi araçlar yapay zeka güdümlü ofansif güvenliğin ticarileşmesini temsil ediyor.

Yıllarca Dinamik Uygulama Güvenliği Testi (DAST) tarayıcılarına güvendik. DAST gürültülü, yavaş ve sınırlı olmasıyla bilinir —uygulamalara devasa statik payload listeleri gönderir ve bir şeylerin tutmasını umar. XBOW ise dijital bir kırmızı takım (red team) gibi hareket eder.

İşte XBOW gibi platformların oyunu nasıl değiştirdiği:

Uyarlanabilir İstismar: XBOW sadece bir payload göndermez; sunucunun yanıtını okur. Eğer bir Web Uygulama Güvenlik Duvarı (WAF) bunu engellerse, XBOW engeli analiz eder ve payload’u korumayı atlatacak şekilde mutasyona uğratır.
İş Mantığı Saldırıları: Geleneksel tarayıcılar bağlamı anlayamaz. XBOW, IDOR (Güvensiz Doğrudan Nesne Referansı) ve BOLA (Bozuk Nesne Seviyesi Yetkilendirme) testlerini gerçekleştirmek için yapay zeka kullanır. Bir sayfaya bakabilir, kullanıcı rolü A’nın kullanıcı B’nin verilerini görmemesi gerektiğini anlayabilir ve bunu aktif olarak istismar edebilir.
Zafiyet Zincirleme: Bir tarayıcı bir SSRF (Sunucu Tarafı İstek Sahteciliği) bulabilir. XBOW bu SSRF’yi bulacak, iç ağa sızacak, AWS meta verilerini çıkaracak ve bu SSRF’yi tam bir RCE’ye dönüştürmeye çalışacaktır.

3. Asimetri Ekonomisi: Bir Öğle Yemeği Fiyatına Sistem Erişimi

Belki de 2026’da çıkan en yıkıcı araştırma yapay zekanın nasıl hacklediği değil, kaça mal olduğu üzerinedir.

Tarihsel olarak, ofansif faaliyetler insan emeği ile kısıtlıydı. Karmaşık bir Active Directory (AD) ortamının yüksek kaliteli, manuel sızma testi 15.000 ila 50.000 dolar arasındadır ve haftalar sürer.

LLM tabanlı sızma testi ajanları üzerine yapılan son araştırmalar bu ekonomik modeli yerle bir etti. 2026 başlarında araştırmacılar, Excalibur‘u (PentestGPT V2 üzerine inşa edilmiş bir ajan) gerçekçi bir Active Directory ortamına karşı test ettiler. Ajan, gerçek yanal hareketler gerçekleştirerek beş ana bilgisayardan dördünü başarıyla ele geçirdi.

Maliyet? API ücretlerinde 28,50 dolar.
Hız? Ajan lineer çalışmadığı —erişilebilir her yüzeyi eşzamanlı olarak keşfettiği— için, bir ekibin işini çok kısa bir sürede tamamladı.

Karmaşık, çok aşamalı bir saldırı zincirini yürütmenin marjinal maliyeti neredeyse sıfıra düştüğünde, dış perimetre üzerindeki sofistike yoklamaların hacmi sonsuza kadar ölçeklenecektir.

4. “Küçük Model” Devrimi (SLMs)

Mythos gibi devasa modeller manşetleri süslerken, ciddi kurumsal güvenlik Küçük Dil Modellerine (SLM) yöneliyor.

Neden? Çünkü son derece hassas, tescilli ağ telemetri verilerinizi üçüncü taraf bir API’ye göndermek bir uyumluluk kabusudur. İşletmelerin, kendi özel ortamlarını anlayan, yerinde (on-premises) çalışan, hiper uzmanlaşmış modellere ihtiyacı vardır.

2025 sonu ve 2026’daki araştırmalar (SecKnowledge veri seti girişimleri gibi), hataları avlamak için trilyon parametreli bir modele ihtiyacınız olmadığını kanıtladı. Araştırmacılar, küçük modelleri sadece saldırgan Taktikleri, Teknikleri ve Prosedürleri (TTP), istismar payload’ları ve ağ yapılandırmaları üzerinde ince ayar (fine-tuning) yaparak yerel olarak çalışan uzman modeller oluşturdular.

Bu küçük modeller şunlarda mükemmeldir:

Hipotez Güdümlü Tehdit Avcılığı: Halüsinasyon görmeden gürültülü logları süzmek.
Veri Yerelliği Uyumluluğu: Tamamen kapalı veya kısıtlı ortamlar içinde çalışmak.
Hız: Gecikme nedeniyle devasa modellerin yetişemeyeceği bir hızda yerelleştirilmiş fuzzer payload’ları oluşturmak.

Savunmacılar İçin Gerçeklik

Bir araştırmacı olarak, bunun gelişimini izlemek hem heyecan verici hem de korkutucu. “Bekleme süresine” (dwell time) güvenilen günler geride kaldı. Bir yapay zeka ajanı bir perimetreyi delerse, uykuya ihtiyacı yoktur, hafta sonu tatili yapmaz ve ortamları makine hızında işler.

Otomatik, uyarlanabilir ve akıl yürüten bir düşmana karşı tek uygulanabilir savunma, tamamen otomatik, uyarlanabilir ve akıl yürüten bir savunmadır. Savunma amaçlı küçük modellerinizin, ofansif otonom ajanlarla gerçek zamanlı ve sürekli bir bıçak kavgasında olacağı çoklu ajan savaşları çağına giriyoruz.

Yama yönetimi artık yeterli değil. Güvenlik stratejiniz, siz bir toplantı ayarlayana kadar sıfırıncı günleri bulabilen bir düşmanı hesaba katmıyorsa, zaten geride kalmışsınız demektir.

Ghaznix Blog’da daha fazla teknik incelemeyi keşfedin ←