시리는 제미나이가 아니다…애플 20B 온디바이스 자체 모델의 실체
구글 제미나이가 새 시리를 구동한다는 보도와 달리, 애플 자체 기술 문서에 따르면 온디바이스 엔진은 애플이 독자 개발한 200억 매개변수 규모의 'AFM 3 코어 어드밴스드(AFM 3 Core Advanced)'인 것으로 나타났다.
애플이 2026년 6월 8일 개발자 회의(WWDC 2026) 무대에 올라 전면 개편한 시리를 공개하기 전까지, 업계의 관측은 하나로 수렴했다. 새 시리의 두뇌가 구글 제미나이일 것이라는 전망이었다. 연간 약 10억 달러의 비용과 1조 2,000억 매개변수라는 구체적인 수치까지 뒤따랐다.
하지만 같은 주 애플이 직접 공개한 모델 설명서는 다른 사실을 가리켰다. 기기 내부에서 시리를 구동하는 온디바이스 지능은 제미나이가 아니었다. 애플이 독자 설계한 200억 매개변수 규모의 자체 모델이었다.
‘제미나이가 시리를 구동한다’던 초기 보도
이러한 관측은 블룸버그 보도에서 시작됐다. 마크 거먼 기자는 지난해 11월 보도에서 애플이 구글의 1조 2,000억 매개변수 맞춤형 제미나이 모델을 새 시리에 도입할 계획이라고 전했다. 이는 애플이 기존에 운영하던 1,500억 매개변수급 자체 클라우드 모델의 8배에 달하는 규모였다.
양사는 2026년 1월 12일 공동 성명을 통해 다년 협력을 공식화했다. 구글은 차세대 애플 파운데이션 모델이 구글 제미나이와 클라우드 기술을 기반으로 개발될 것이라 발표했고, 외신들은 애플이 그 대가로 연간 약 10억 달러를 지급한다고 보도했다. 발표 시점과 거래 규모, 공식 문구가 모두 맞아떨어지자 시장은 제미나이가 곧 시리의 두뇌가 될 것으로 받아들였다. 개발자 회의 직전에 나온 사전 보도들 역시 같은 그림을 그렸다.
시리의 진짜 두뇌는 애플 자체 20B 온디바이스 모델
하지만 6월에 공개된 애플의 3세대 파운데이션 모델 기술 문서는 이러한 시장의 추정을 비껴갔다. 애플은 자사 모델 5종으로 구성된 제품군을 '구글과의 협력 하에 맞춤형으로 제작했다'고 설명했으나, 시리를 제미나이라고 명명한 대목은 단 한 군데도 없었다.
온디바이스 인공지능의 핵심은 'AFM 3 코어 어드밴스드(AFM 3 Core Advanced)'다. 200억 매개변수 규모이지만 요청당 10억~40억 개만 활성화하는 희소 구조로, 애플의 독자적인 '지시어 준수 가지치기(IFP)' 기술이 적용됐다. 전체 가중치는 플래시 메모리에 두고 필요한 전문가 모듈만 DRAM으로 실시간 로드해 기기 메모리 한계를 극복하는 방식이다.
이 모델은 주로 자연스러운 음성 출력과 비약적으로 향상된 받아쓰기 기능을 담당한다. 애플 자체 평가에 따르면 새 음성 합성 기술은 5점 만점에 4.15점을 기록해 기존 시스템(3.87점)을 앞섰으며, 대화체 텍스트에서는 그 격차가 더 벌어졌다. 다만 이 기능들은 최소 12GB 이상의 메모리를 탑재한 아이폰 17 프로, 아이폰 에어, M4 탑재 아이패드 등 최신 하드웨어에서만 지원된다.
구글의 실제 역할은 어디에 있나
그렇다면 애플이 구글에 지급하는 연간 약 10억 달러는 어디에 쓰였을까. 애플의 설명을 따라가 보면 그 답은 모델 자체의 설계가 아닌, 모델의 제작 인프라에 있다.
애플은 자사 모델 전체를 구글 클라우드의 최신 TPU를 활용해 사전학습했다고 설명했다. 특히 가장 크기가 큰 서버용 모델인 'AFM 3 클라우드 프로(AFM 3 Cloud Pro)'는 구글 및 엔비디아와 협력해 구글 클라우드 내 엔비디아 GPU로 확장한 프라이빗 클라우드 컴퓨트 인프라에서 구동된다.
결국 '제미나이가 시리를 구동한다'는 세간의 헤드라인과 '구글과의 협력으로 맞춤 제작했다'는 애플의 공식 설명 사이에는 분명한 간극이 존재한다. 실제로 애플의 공식 기술 문서 어디에도 제미나이라는 명칭은 등장하지 않는다. 온디바이스 엔진은 애플이 직접 설계한 독자 모델이며, 구글의 역할은 모델 학습과 서버 인프라 제공 및 공동 개발에 국한되어 있다.
결과적으로 새 시리는 구글의 기술을 빌려 쓴 서비스와 애플이 자체 구축한 독자 서비스의 중간 지점에 위치한다. 사용자가 매일 마주하는 온디바이스 시리는 애플의 자체 모델이 처리하고, 고도로 복잡한 요청만 구글 인프라 기반의 서버 모델로 넘기는 구조다. 이를 단순히 제미나이라는 한 단어로 규정하는 것은 다층적으로 설계된 시리의 진짜 기술적 실체를 놓치는 일이다.
- Apple Machine Learning Research - Introducing the Third Generation of Apple's Foundation Models
- Apple Newsroom - Apple introduces Siri AI, a profoundly more capable and personal assistant
- Bloomberg - Apple Plans to Use 1.2-Trillion-Parameter Google Gemini Model to Power New Siri
- CNBC - Apple and Google announce AI partnership to power Siri with Gemini
- Google - A joint statement from Google and Apple