💡 站外导读:一条重磅消息震动科技圈:苹果下一代Siri的“大脑”,将不再是简单的外部模型集成,而是一颗由谷歌为其量身定制的1.2万亿参数巨型AI模型。这标志着AI军备竞赛进入全新维度——从云端比拼参数,转向端侧决胜体验。核心痛点已然浮现:如何在iPhone有限的功耗和散热条件下,让这颗“巨脑”飞速运转,实现即时、精准且隐私安全的本地化响应?这不仅是技术难题,更将决定亿级用户的交互体验与巨头生态的竞争格局。
北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。
这一规模远超当前主流移动端模型,引发业界高度关注。
模型规模碾压:1.2T vs Gemini 3.5 Flash 300B
根据估算,Gemini 3.5 Flash 拥有大约 3000 亿个参数,而苹果这次定制的模型参数规模达到了 1.2 万亿,体量上要大得多。AIbase 分析认为,如果能有效地部署如此庞大的模型,Siri 的理解能力、推理水平以及处理复杂任务的性能都将得到显著增强,特别是在多模态交互和对上下文的理解方面,有望带来实质性的突破。
性能与速度:本地响应是最大考验
尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。
AIbase 指出,模型参数“足够大”并不等同于效果就一定“足够好”。在移动设备的应用场景中,如何平衡响应延迟、能耗表现和结果准确率,才是决定成败的核心因素。苹果能否在 1.2 万亿参数的大模型上,实现高效的本地或混合部署方式,将直接影响此次 Siri 大规模升级后,用户获得的实际体验。
下半年 AI 大战一触即发
随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:
- WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
- GPT-5.6:OpenAI 下一代模型进展
- Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
- Gemini 3.5 Pro:谷歌已确认即将推出
AIbase 将持续关注苹果 Siri 的升级动态,以及大模型在终端设备上的实际运行效果。这场围绕参数规模、推理速度与隐私安全的 AI 竞争,正日益贴近消费者的日常使用环境。最终谁能在竞争中脱颖而出,我们拭目以待。
📝 站长洞察 (Editor’s Insight)
此次升级绝非简单的参数堆砌,而是苹果在“端云协同”战略上的关键落子。1.2万亿参数的本地/混合部署尝试,是AI民主化与深度融入操作系统的一次极限测试。它揭示了三个行业级趋势:第一,AI能力正从“服务”下沉为“系统核心能力”,操作系统级的深度整合将是下一代智能设备的标配。第二,端侧推理效率成为比云端参数规模更核心的战场,能效比(Performance per Watt)将取代纯粹的跑分成为新标尺。第三,顶级AI能力的供给模式发生根本变化,谷歌向苹果输出定制化“巨脑”模型,意味着AI基建正在以“芯片级”的定制模式进入顶级硬件供应链,这或将重塑整个AI产业的合作与竞争关系。下半年,我们将看到的不仅是模型的迭代,更是整个智能终端体验逻辑的重构。
