MS, 첫 자체 추론 AI 모델 'MAI-Thinking-1' 공개
마이크로소프트가 연례 개발자 행사 빌드 2026에서 첫 자체 추론 AI 모델 'MAI-Thinking-1'을 발표했다. 타사 모델의 지식을 빌리지 않고 독자 학습 방식으로 개발됐으며, 코딩 벤치마크 평가에서 클로드 오푸스 4.6에 준하는 성능을 입증했다.
마이크로소프트(MS)가 6월 2일 연례 개발자 콘퍼런스 '빌드 2026'에서 첫 자체 추론 인공지능(AI) 모델인 'MAI-Thinking-1'을 공개했다. 무스타파 수레이만이 이끄는 마이크로소프트 AI(MAI) 사업부가 개발한 이 모델은 이날 발표된 7종의 마이크로소프트 자체 모델 중 단연 핵심으로 꼽힌다.
MAI-Thinking-1은 활성 매개변수(파라미터) 350억 개, 전체 매개변수 약 1조 개 규모의 전문가 혼합(MoE) 구조로 설계됐다. 회사 측은 중간급 크기임에도 거대 모델보다 추론 비용이 저렴하다고 강조했다. 그동안 오픈AI 모델에 전적으로 의존해 온 MS가 독자 노선 구축에 시동을 걸었다는 분석이다.
추론 모델 성능, 코딩 벤치마크서 클로드 오푸스 4.6과 경쟁
MS가 이번 신작에서 내세운 주력 분야는 코딩과 수학이다. MS는 MAI-Thinking-1이 까다로운 소프트웨어 엔지니어링 성능 지표인 'SWE-Bench Pro'에서 앤트로픽의 클로드 오푸스 4.6과 대등한 성적을 거뒀다고 전했다. 매일 일상적으로 구동할 수 있는 중간급 모델 크기에서 최고 수준의 코딩 성능을 구현했다는 설명이다.
사용자가 실제 체감하는 품질 검증에서도 합격점을 받았다. 데이터 평가 기업 서지(Surge)의 평가단이 진행한 블라인드 선호도 조사 결과, 이 모델은 단일 및 다중 질문 작업 전반에서 클로드 소네트 4.6과 동등한 만족도를 기록했다. 고급 수학 추론 영역에서도 동급의 선두권 모델들과 어깨를 나란히 했다.
| 평가 항목 | MAI-Thinking-1 | 비교 대상 |
|---|---|---|
| 구조 | MoE · 활성 350억 / 총 약 1조 | — |
| SWE-Bench Pro (코딩) | 오푸스 4.6과 대등 | 오푸스 4.6: 51.9* |
| 블라인드 선호도 | 소네트 4.6과 동률 | 소네트 4.6 |
| 고급 수학 | 동급 선두권과 대등 | — |
독자 데이터 학습부터 전용 반도체 협업까지
단순 성능 점수보다 MS가 앞세우는 강점은 독창적인 개발 방법론이다. 이 모델은 타사 인공지능 출력을 모방해 학습하는 '증류(distillation)' 기법을 쓰지 않고 처음부터 자체적으로 훈련됐다. 훈련에 사용한 데이터셋 역시 무분별한 웹 크롤링이 아니라 정제되고 합법적인 라이선스 데이터만 활용했다고 회사 측은 강조했다.
아키텍처부터 학습 파이프라인까지 전 과정을 자체 개발했으며, 전용 가속기 '마이아 200' 칩과의 결합으로 연산 효율을 1.4배 높였다. 이날 공개된 신규 마이크로소프트 자체 모델 7종이 모두 이 기반을 공유한다. 오픈AI와의 협력 구도를 조정하며 기술 독립을 선언한 MS의 행보는, 최근 윈도우에서 코파일럿 노출을 조율하던 조심스러운 움직임과 확연한 대비를 이룬다.
기업 맞춤형 모델 학습 '프런티어 튜닝' 지원
범용 모델 제시를 넘어 개별 기업 환경에 맞춤 설계하는 전략도 동반됐다. MS는 고객사가 고유 데이터를 활용해 모델을 직접 미세 조정하는 '프런티어 튜닝(Frontier Tuning)' 기술을 공개했다. 업무 과정에서 발생하는 결정과 행동 단위를 강화학습 환경(RLE)에 입력해, 각 조직 특유의 업무 방식을 모델이 그대로 학습하도록 돕는다.
맞춤 튜닝의 실질적인 효율은 수치로 입증됐다. 엑셀용 최적화 모델은 GPT-5.4급 능력을 유지하면서도 효율성을 최대 10배 끌어올렸다. 컨설팅 그룹 맥킨지의 실무 기준에 맞춘 모델은 평가 대상 중 최고 성적을 내면서 비용은 약 10분의 1로 낮췄다. MS는 메이오 클리닉과 협력해 의료 특화 모델을 공동 개발 중이며, 이 모델의 지식재산권은 병원 측이 소유한다.
인간 통제 아래 돕는 '휴머니스트 초지능' 지향
이번에 발표된 MAI-Thinking-1은 MS의 기업용 연산 플랫폼인 '마이크로소프트 파운드리'에서 비공개 테스트 버전으로 먼저 제공된다. 개발자들은 파운드리 외에도 오픈라우터, 파이어웍스, 베이스텐 등 다양한 플랫폼을 통해 가중치를 조정할 수 있다. MS는 합리적 비용과 강력한 안전 장치, 저작권 보호를 강점으로 내세워 시장 전환을 노린다.
수레이만 마이크로소프트 AI 대표는 이번 여정의 종착지를 인간을 보조하고 통제권 아래 두는 '휴머니스트 초지능'으로 정의했다. 이를 위해 위험한 동조나 불필요한 거부를 강화학습 단계에서 동일한 시스템 결함으로 간주해 정교하게 필터링한다. MS는 향후 1년간 인프라 투자와 연구 개발을 지속해 연산 능력과 추론 지능을 키울 방침이다. 사람을 대체하지 않는 휴머니스트 초지능, 그 첫 실물이 MAI-Thinking-1인 셈이다.