미토스2 루머 공방... X 달군 '새 체크포인트' 소동

Editor J
미토스2 루머 공방... X 달군 '새 체크포인트' 소동

영국 AISI의 평가 결과 공개로 지난 6월 3~4일 X(옛 트위터)가 클로드 미토스의 차세대 모델 테스트설로 들끓었다. 신규 모델 여부를 두고 맞붙은 공방의 쟁점을 정리했다.

6월 3일 밤부터 4일 새벽 사이 X(옛 트위터)가 '클로드 미토스(Claude Mythos)'의 새로운 체크포인트 이야기로 들끓었다. 발단은 영국 AI보안연구소(AISI)가 발표한 짤막한 평가 결과였다. 지난 4월 테스트한 모델의 최신 스냅샷을 다시 평가한 결과, 성능 점수가 큰 폭으로 상승했다는 내용이 골자다.

해당 수치가 공개되자 소셜미디어상에서는 앤트로픽이 차세대 모델인 '미토스 2'를 테스트 중인 것 아니냐는 추측이 쏟아졌다. 반면 일각에서는 지난 4월 모델과 동일하며 추가 학습본에 불과하다는 반론이 팽팽히 맞섰다. 이틀간 X를 달군 미토스2 루머의 주요 쟁점을 정리했다.

이번 논란의 발단이 된 AISI 공식 게시물

발단: AISI가 평가한 '새 체크포인트'

클로드 미토스를 개발한 앤트로픽의 로고
앤트로픽 로고

AISI는 그동안 모의 침투 환경을 구축해 클로드 미토스를 비롯한 최신 인공지능(AI) 모델의 자율적 사이버 공격 능력을 평가해 왔다. 이번 사이버 평가 발표의 핵심 역시 프로젝트 글래스윙에 공급된 미토스 계열 모델의 성능을 짚은 대목에 집중됐다.

첫 미토스 평가 이후, 우리는 더 새로운 미토스 프리뷰 체크포인트에 접근할 수 있었다. 인간 전문가가 약 20시간 걸리는 32단계 기업망 공격을, 이 체크포인트는 열 번 중 여섯 번 끝까지 완수했다.

기존 체크포인트가 동일 과제인 '더 라스트 원스(The Last Ones)'를 열 번 중 세 번 해결한 것과 비교하면 두 배에 달하는 성과다. 이에 더해 이전까지 어떤 모델도 돌파하지 못했던 '냉각탑(Cooling Tower)' 사이버 레인지마저 30%의 확률로 통과했다. AISI가 공개한 평가 결과에 따르면, 두 과제를 모두 통과한 모델은 이번이 처음이다. 한편 같은 평가에서 GPT-5.5는 '더 라스트 원스'를 열 번 중 세 번 해결하는 데 그쳤다.

'미토스 2 테스트 중' 소문 확산

스마트폰 화면에 표시된 인공지능 브랜드 로고
클로드 로고

성공률 60%라는 구체적인 수치가 공개되자 X의 반응은 빠르게 달아올랐다. 소셜미디어에는 관련 내용을 빠르게 실어 나르는 게시글이 잇따랐다.

속보. AISI가 더 새로운 미토스 체크포인트를 시험했다. 이 숫자들은 말이 안 된다 — 20시간짜리 과제를 열 번에 여섯 번이나 풀었다.

앤트로픽 동향을 추적해 온 인사이더 계정도 가세했다. @synthwavedd는 막연한 추측을 넘어 '단독(SCOOP)'을 달고 한층 구체적인 주장을 내놨다.

단독. 앤트로픽이 미토스 프리뷰보다 더 나은 새 버전 미토스의 일반 공개를 준비하고 있다.
새 버전 미토스 공개 준비를 주장한 단독 게시물

프로젝트 글래스윙 프리뷰에 묶여 있던 모델이라는 점이 오히려 기대를 키웠고, 시장의 전망은 빠르게 앞서 나갔다. 한 유력 인플루언서는 구체적인 근거를 제시하지 않은 채 미토스 2가 이미 내부 테스트 단계에 들어섰다고 단언했다. 비록 명확한 증거가 없는 주장이었으나, 앞서 보도된 일반 공개 임박 관측과 맞물리며 소문은 삽시간에 퍼졌다.

엔트로픽은 이미 미토스2를 돌리고 있다. 첫 출시를 기다리는 동안 말이다. 다음은 미토스3 차례다.

여기에 프로젝트 글래스윙(Project Glasswing)을 이끄는 로건 그레이엄(Logan Graham)이 '미토스 프리뷰는 비약적인 발전(step change)'이라고 언급하면서 루머에 불을 지폈다. 공식 출시를 앞두고 더 강력한 모델이 은밀히 테스트되고 있다는 시나리오는 당시 분위기 속에서 꽤 설득력 있게 받아들여졌다.

신중론 대두: '기존 4월 모델일 뿐'

하지만 이내 차분한 해석을 제기하는 정정 게시글들이 올라오며 과열된 분위기가 가라앉았다.

정정한다. 이 결과는 4월 7일 공개된 바로 그 미토스 프리뷰에서 나온 것이다. 적어도 공개된 범위에서 '새' 미토스 체크포인트는 없다.

일각에서는 최초의 미토스 모델이 공개된 지 불과 5주밖에 지나지 않았다는 점을 지적했다. AISI가 언급한 '새로운 체크포인트'는 별개의 신규 모델이 아니라, 프로젝트 글래스윙에 투입된 기존 모델의 후속 학습 스냅샷일 가능성이 크다는 분석이다. 실제로 AISI 역시 보고서에서 새 모델을 출시하지 않더라도 동일한 모델의 미세 조정과 반복 학습만으로 성능 추정치가 크게 달라질 수 있다고 명시한 바 있다.

결과적으로 앤트로픽은 '미토스 2'에 대해 공식적으로 언급한 적이 없다. 마침 지난 6월 2일 프로젝트 글래스윙의 파트너십 대상이 15개국 150여 개 기관으로 확대되며 클로드 미토스에 대한 대중의 기대감이 한층 고조된 시점이었을 뿐이다. 결국 이번 미토스2 루머는 신규 모델의 등장이라기보다, 기존 클로드 미토스의 성능 개선 속도가 시장의 예상보다 훨씬 빠르다는 점에 놀란 해프닝에 가깝다.

목록 다음 ›
메뉴