제로데이 특이점: 클로드 미토스와 자율 RCE 시대의 도래
솔직히 말해봅시다. 한동안 “사이버 보안 분야의 AI"라는 수식어는 피로감을 주었습니다. 우리는 벤더들이 표준 정규식 기반 정적 분석 도구에 “AI 기반” 스티커를 붙이는 것을 보았고, 스크립트 키디들이 초기 LLM을 사용해 노이즈가 많고 조잡한 피싱 이메일을 작성하는 것을 지켜보았습니다.
하지만 2026년 중반인 지금, 그러한 농담은 공식적으로 끝났습니다.
공격형 보안의 지형은 단순히 변화한 것이 아니라 근본적으로 균열이 생겼습니다. 우리는 더 이상 인간 모의 해킹 전문가가 까다로운 페이로드를 작성하는 것을 돕는 “조수"로서의 AI를 이야기하지 않습니다. 우리는 복잡한 비즈니스 로직을 추론하고, 취약점을 연쇄적으로 엮어내며, 인간 분석가가 첫 잔의 커피를 다 마시기도 전에 서버 권한(Shell)을 탈취할 수 있는 완전히 자율적이고 병렬화된 에이전트를 상대하고 있습니다.
프론티어 모델의 무시무시한 일반 추론 능력부터 소형 언어 모델(SLM)의 예리한 정밀도에 이르기까지, 현재 공격형 AI 환경의 실제 모습을 최전선의 시각에서 전달해 드립니다.
1. 일반 추론의 거인: 클로드 미토스 (Claude Mythos)
현재 보안 커뮤니티의 패닉을 이해하고 싶다면 2026년 4월에 출시된 앤스로픽(Anthropic)의 클로드 미토스를 주목하십시오.
미토스는 단순히 평가 벤치마크를 통과한 것에 그치지 않고, AI 위험 평가 기관인 METR의 평가 방법론 자체를 무너뜨렸습니다. 하지만 보안 연구원들이 밤잠을 설치는 이유는 미토스가 실제 환경에서 보여준 성과 때문입니다. 명시적인 공격 훈련 없이도—순수하게 일반 추론과 코딩 자율성의 거대한 도약으로 탄생한—미토스는 수천 개의 알려지지 않은 취약점을 자율적으로 발견했습니다.
단순한 크로스 사이트 스크립팅(XSS) 버그만 찾은 것이 아닙니다. FreeBSD의 NFS 서버에서 17년 된 원격 코드 실행(RCE) 취약점을 찾아냈고, 수십 년간 인간의 동료 검토(Peer Review)를 견뎌낸 27년 된 브라우저 결함을 발견했습니다. 그리고 그 다음은? 인간의 가이드 없이 이들에 대한 완전한 기능을 갖춘 익스플로잇(Exploit)을 작성했습니다.
이것이 바로 앤스로픽이 “프로젝트 글래스윙(Project Glasswing)“을 통해 출시를 제한하고, 모델이 널리 보급되기 전에 거대 IT 기업(애플, 마이크로소프트, 구글)들이 인프라를 강화할 수 있도록 한 이유입니다. 미토스는 무서운 개념을 증명했습니다. 공격 능력은 더 이상 설계상의 선택이 아니며, 충분히 똑똑한 AI라면 필연적으로 나타나는 창발적 특성이라는 것입니다.
2. 자율성의 제품화: XBOW와 DAST의 종말
미토스가 일반 지능의 최전선을 상징한다면, XBOW와 같은 도구는 AI 기반 공격 보안의 상업화를 상징합니다.
수년 동안 우리는 동적 애플리케이션 보안 테스트(DAST) 스캐너에 의존해 왔습니다. DAST는 노이즈가 많고 느리며 멍청하기로 악명이 높았습니다. 단순히 정적 페이로드 목록을 애플리케이션에 대량으로 쏟아붓고 무엇 하나 걸리기를 바라는 방식이었죠. 반면 XBOW는 디지털 레드 팀(Red Team)처럼 행동합니다.
XBOW와 같은 플랫폼이 게임의 룰을 바꾸는 방식은 다음과 같습니다:
- 적응형 침투: XBOW는 단순히 페이로드를 보내는 것에 그치지 않고 서버의 응답을 읽습니다. 웹 애플리케이션 방화벽(WAF)이 차단하면, XBOW는 차단 사유를 분석하고 가드레일을 우회하도록 페이로드를 변형합니다.
- 비즈니스 로직 공격: 전통적인 스캐너는 맥락을 이해하지 못합니다. XBOW는 AI를 사용하여 IDOR(부적절한 직접 객체 참조) 및 BOLA(취약한 객체 수준 권한 부여) 테스트를 수행합니다. 페이지를 보고 사용자 역할 A가 사용자 B의 데이터를 봐서는 안 된다는 것을 이해하고 이를 능동적으로 공격합니다.
- 취약점 연쇄: 일반 스캐너는 SSRF(서버 측 요청 위조)를 찾을 수 있습니다. XBOW는 이 SSRF를 찾은 뒤, 내부 네트워크로 피벗(Pivot)하고 AWS 메타데이터를 추출하여 해당 SSRF를 완전한 RCE로 전환하려고 시도합니다.
3. 비대칭의 경제학: 점심 한 끼 가격으로 탈취되는 권한
2026년에 발표된 연구 중 가장 파괴적인 것은 AI가 어떻게 해킹하느냐가 아니라 비용이 얼마나 드느냐일 것입니다.
역사적으로 공격 활동은 인적 노동력에 의해 제약받았습니다. 복잡한 액티브 디렉토리(AD) 환경에 대한 고품질의 수동 모의 해킹 비용은 15,000달러에서 50,000달러 사이이며 몇 주가 소요됩니다.
LLM 기반 모의 해킹 에이전트에 대한 최근 연구는 이러한 경제 모델을 완전히 파괴했습니다. 2026년 초, 연구원들은 실제 액티브 디렉토리 환경을 대상으로 엑스칼리버(Excalibur)(PentestGPT V2 기반 에이전트)를 테스트했습니다. 이 에이전트는 5대의 호스트 중 4대를 성공적으로 장악하며 실제 횡적 이동(Lateral Movement)을 수행했습니다.
- 비용은? API 수수료로 단 28.50달러.
- 속도는? 에이전트가 선형적으로 작동하지 않고 도달 가능한 모든 표면을 동시에 탐색했기 때문에, 팀 단위의 작업을 아주 짧은 시간 안에 완료했습니다.
복잡한 다단계 공격 체인을 실행하는 한계 비용이 거의 제로에 수렴하게 되면, 외부 경계에 대한 정교한 탐색의 양은 무한대로 확장될 것입니다.
4. “소형 모델” 혁명(SLM)
미토스와 같은 프론티어 모델이 헤드라인을 장식하는 동안, 진지한 엔터프라이즈 보안은 **소형 언어 모델(SLM)**로 이동하고 있습니다.
왜일까요? 민감한 독점 네트워크 원격 측정 데이터를 서드파티 API로 전송하는 것은 규정 준수(Compliance) 측면에서 악몽이기 때문입니다. 기업은 특정 환경을 이해하고 온프레미스에서 작동하는 고도로 전문화된 모델이 필요합니다.
2025년 말과 2026년의 연구(SecKnowledge 데이터셋 이니셔티브 등)는 버그를 찾기 위해 조 단위 파라미터 모델이 필요하지 않다는 것을 증명했습니다. 공격자의 전술, 기술, 절차(TTP), 익스플로잇 페이로드, 네트워크 구성에 대해서만 SLM을 미세 조정함으로써 연구원들은 로컬에서 실행되는 도메인 전문가 모델을 만들었습니다.
이러한 SLM은 다음과 같은 분야에서 탁월합니다:
- 가설 기반 위협 헌팅: 환각(Hallucination) 없이 노이즈가 많은 로그를 정밀 조사.
- 데이터 거주성 준수: 외부와 차단된(Air-gapped) 환경이나 고도로 제한된 환경 내에서 완벽하게 작동.
- 속도: 지연 시간 때문에 대규모 모델이 따라올 수 없는 속도로 현지화된 퍼징(Fuzzing) 페이로드를 생성.
방어자의 현실
연구원으로서 이 현상을 지켜보는 것은 짜릿하면서도 무섭습니다. “체류 시간(Dwell Time)“에 의존하던 시대는 끝났습니다. AI 에이전트가 경계를 뚫으면 수면도 필요 없고 주말도 쉬지 않으며 기계의 속도로 환경을 처리합니다.
자동화되고 적응하며 추론하는 적에 대한 유일한 유효한 방어는 완전히 자동화되고 적응하며 추론하는 방어뿐입니다. 우리는 방어용 SLM이 공격용 자율 에이전트와 실시간으로 끊임없이 사투를 벌이는 멀티 에이전트 전쟁의 시대로 진입하고 있습니다.
패치 관리만으로는 더 이상 충분하지 않습니다. 회의를 소집하는 것보다 더 빨리 제로데이를 찾아낼 수 있는 적을 고려하지 않은 보안 전략을 가지고 있다면, 당신은 이미 뒤처진 것입니다.