北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型,引发业界高度关注。

模型规模碾压:1.2T vs Gemini 3.5 Flash 300B

根据估算,Gemini 3.5 Flash 拥有大约 3000 亿个参数,而苹果这次定制的模型参数规模达到了 1.2 万亿,体量上要大得多。AIbase 分析认为,如果能有效地部署如此庞大的模型,Siri 的理解能力、推理水平以及处理复杂任务的性能都将得到显著增强,特别是在多模态交互和对上下文的理解方面,有望带来实质性的突破。

性能与速度:本地响应是最大考验

尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。

AIbase 指出,模型参数“足够大”并不等同于效果就一定“足够好”。在移动设备的应用场景中,如何平衡响应延迟、能耗表现和结果准确率,才是决定成败的核心因素。苹果能否在 1.2 万亿参数的大模型上,实现高效的本地或混合部署方式,将直接影响此次 Siri 大规模升级后,用户获得的实际体验。

下半年 AI 大战一触即发

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:

  • WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
  • GPT-5.6:OpenAI 下一代模型进展
  • Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
  • Gemini 3.5 Pro:谷歌已确认即将推出

AIbase 将持续关注苹果 Siri 的升级动态,以及大模型在终端设备上的实际运行效果。这场围绕参数规模、推理速度与隐私安全的 AI 竞争,正日益贴近消费者的日常使用环境。最终谁能在竞争中脱颖而出,我们拭目以待。