코파일럿 비용 부담 느낀 MS, 중국 딥시크 도입 저울질

Editor J Jun 17, 2026

마이크로소프트가 비용 부담을 줄이기 위해 코파일럿 일부 기능에 자체 호스팅 방식의 딥시크 도입을 검토하고 있다. GLM-5.2, 키미 K2.7, 딥시크 V4 등 중국 AI 모델들이 프론티어 수준의 성능을 갖추면서 한층 저렴한 대안으로 떠오른 영향이다.

마이크로소프트가 AI 비서 코파일럿의 일부 기능에 중국 딥시크 모델을 도입하는 방안을 검토 중이다. 미국 매체 Axios는 6월 16일 마이크로소프트가 '코파일럿 코워크' 기능에 자체 호스팅 방식의 딥시크 V4 모델을 적용하는 방안을 조율하고 있다고 보도했다. 이르면 수주 내에 저비용 모델 옵션이 공개될 전망이다.

이번 도입 검토의 핵심 배경은 코파일럿 비용 부담이다. 여러 단계를 스스로 처리하는 자율 에이전트 서비스인 코파일럿 코워크는 작업 시간이 길어질수록 토큰 소모량이 급증한다. 오픈AI나 앤트로픽의 고가 프론티어 모델만으로 이 부하를 감당하기에는 코파일럿 비용 구조상 한계가 있다는 분석이다.

코파일럿이 딥시크로 눈을 돌린 이유

코파일럿 비용이 불어나는 원인은 코파일럿 코워크의 작동 방식에 있다. 사용자가 한 번 지시하면 에이전트가 자료 검색, 문서 수정, 교차 검증을 위해 API를 연쇄적으로 호출한다. 생산성 향상에 비례해 운영 비용도 함께 뛰기 때문에, 마이크로소프트는 무제한 요금제에서 사용량 기반 요금제로 개편을 추진하고 있다.

이에 따라 마이크로소프트는 멀티모델 전략을 준비하고 있다. 안전장치를 보완한 딥시크 모델을 애저 클라우드 환경에서 직접 운영하는 방식이다. 마이크로소프트는 고객이 원할 때만 활성화하는 선택 항목으로 제공하며, 사용자 데이터는 애저 인프라 밖으로 절대 나가지 않는다고 강조했다.

일상적인 작업은 저가 모델에 맡기고 핵심 연산에만 프론티어 모델을 투입해 오픈AI 의존도를 낮추겠다는 구상이다. 다만 미국 빅테크 기업이 자사 주력 제품에 중국산 모델을 탑재하는 흐름이 워싱턴 정가의 견제를 부를 수 있다는 우려도 나온다. 미국 매체 Gizmodo는 정치적 마찰 가능성을 제기했다.

프론티어 턱밑까지 쫓아온 중국 모델

GLM-5.2의 100만 토큰 컨텍스트 공개를 알리는 그래픽 — 지푸 AI(Z.ai)가 공개한 GLM-5.2 소개 이미지

마이크로소프트가 이 옵션을 진지하게 검토하는 배경에는 최근 몇 달 사이 급속도로 성장한 중국 AI 모델 성능이 있다. 지푸 AI(Z.ai)가 6월 13일 공개한 GLM-5.2는 100만 토큰 컨텍스트를 안정적으로 처리하며 터미널벤치 2.1에서 81.0점을 기록했다. 85.0점을 획득한 클로드 오푸스 4.8과의 성능 격차는 이제 한 자릿수에 불과하다.

다른 중국 개발사들도 성과를 내고 있다. 문샷이 6월 12일 선보인 키미 K2.7 코드는 이전 세대보다 추론 토큰 소모를 30% 감축했다. 4월 출시된 딥시크 V4 프로는 개발자 벤치마크인 SWE벤치 검증에서 80%대 정확도를 기록했다. 세 모델 모두 100만 토큰의 컨텍스트 환경과 오픈 가중치를 지원한다.

자체 벤치마크 결과인 만큼 교차 검증이 필요하지만, 초기 실사용 평가도 대체로 긍정적이다. 실제 GLM-5.2 실사용기를 보면 코딩 작업 성능은 좋은 평가를 받았으나, 요금제 설계나 시스템 안정성 면에서는 아쉬움이 제기됐다. 그럼에도 이들 모델이 비싼 모델을 대신할 프론티어 대안으로 손색없다는 분석이 힘을 얻고 있다.

정가 10배, 실사용은 50배

비슷한 성능 조건에서 가격 차이는 한층 극적으로 벌어진다. 딥시크 V4 프로의 100만 토큰당 출력 비용은 0.87달러다. 각각 25달러와 30달러인 클로드 오푸스 4.8 및 GPT-5.5와 단순 비교해도 최대 34배가량 저렴하다. 경량 모델인 V4 플래시는 출력 단가가 0.28달러로, 클로드 오푸스 대비 약 90배 싸다.

실사용 비용 차이는 공식 가격표를 웃돈다. 딥시크는 상시 75% 할인을 제공하며, 중복 프롬프트의 캐시 입력 단가는 100만 토큰당 0.003625달러까지 내려간다. 코드 최적화 토크나이저 효율까지 감안하면 캐시 기반 워크로드 비용은 프론티어 모델 대비 최대 50배 저렴하다. 클로드 신형 토크나이저가 동일 텍스트에서 토큰을 최대 35% 더 생성하는 점도 격차를 벌린다.

이 단계에 이르면 중국 모델은 비싼 값 탓에 마지못해 고르던 프론티어 대안을 넘어 일상 업무의 기본값으로 올라선다. 마이크로소프트조차 자사 간판 제품에 중국산 모델 도입을 저울질하는 현실은 현재 AI 시장의 흐름이 어디로 기우는지를 분명하게 보여준다.