💡 站外导读:随着汽车智能化竞争进入下半场,智能座舱正从单一语音交互向全域主动服务进化,但传统云端AI面临延迟、隐私与网络依赖瓶颈。商汤绝影推出的端侧智能体基座Sage,以极致效率破解这一行业痛点——它在Orin X平台上以仅3B激活参数达成94%的PinchBench任务完成率,性能反超云端旗舰模型。这不仅标志着端侧AI首次在复杂任务上比肩云端,更预示着智能座舱将彻底摆脱网络枷锁,走向实时、安全、主动的智能体时代。
Sage是什么
Sage是商汤绝影推出的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%,超越Claude-Opus-4.6、GPT-5.4等云端旗舰。Sage搭载SCOUT与ERL两项后训练技术,支持复合指令解析、多系统联动与主动感知,为智能座舱提供云端级Agent能力。
阅读目录

Sage的主要功能
- 复合指令解析:支持一次性解析用户多意图复合指令,自动联动空调、导航、影音等车载系统完成任务闭环。
- 主动感知服务:结合传感器实时感知乘员状态与路况,主动触发儿童模式、路线调整等场景化服务。
- 多模态座舱理解:依托原生车载数据,实现座舱语义与视觉理解,精准识别车内环境与用户需求。
- 工具调用与任务闭环:支持长链路工具调用与多步推理,在τ2-bench基准上实现80分,具备真正的智能体执行能力。
- 端侧实时响应:Orin X平台首字响应约0.5秒,单Token延迟0.03秒,生成吞吐80 tk/s,无需依赖云端。
Sage的技术原理
- MoE稀疏激活架构:总参数32B,激活参数仅3B,通过稀疏激活机制在端侧有限算力下实现高效推理。
- SCOUT分级协同学习:采用”小模型探路、大模型吸收”的分级协同机制,在复杂任务训练中节省约60% GPU小时消耗。
- ERL可擦除强化学习:模型自动识别推理链中的错误步骤并擦除重生成,阻断偏差扩散,复杂任务完成率提升20%。
- 一体化多模态架构:融合视觉、语言与传感器数据的原生训练体系,针对车载场景构建差异化理解能力。
如何使用Sage
模型现已在英伟达 Orin X 端侧平台实现部署。
Sage的关键信息和使用要求
- 模型架构: MoE架构,总参数32B,激活参数3B。
- 部署平台: 已在英伟达Orin X端侧平台实现部署。
- 评测成绩: PinchBench最佳任务完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
- 硬件产品: 北京车展期间推出搭载Sage的SageBox。
- 适用对象: 主要面向车企、Tier 1供应商及端侧智能体开发者。
- 网络要求: 端侧部署,无需依赖云端网络连接即可运行。
- 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。
Sage的核心优势
- 端侧性能领先:用3B激活参数在PinchBench上达到94%任务完成率,超越众多大参数云端旗舰模型。
- 极致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力仅为其1/14,显存占用约1/31,性能高出6.6个百分点。
- 训练成本优化:SCOUT技术节省约60%复杂任务训练GPU小时,降低模型后训练成本。
- 推理纠错能力:ERL技术实现推理过程中错误步骤的自动识别与擦除,从源头阻断任务失败。
- 原生车载数据优势:Human Semantic Understanding测试获91.5分,领先同级端侧模型32%,深度理解座舱场景。
- 量产可行性:已在Orin X平台验证部署,具备车规级量产条件。
Sage的同类竞品对比
| 对比维度 | Sage | Google Gemma 4 | MiMo-v2-Pro |
|---|---|---|---|
| 发布方 | 商汤绝影 | 小米 | |
| 总参数量 | 32B | 同量级端侧 | 超1T |
| 激活参数量 | 3B | 未披露 | 42B |
| PinchBench完成率 | 94% | 83.9% | 87.4% |
| MMLU Pro | 75.8 | 69.2 | – |
| GPQA Diamond | 77.3 | 58.5 | – |
| τ2-bench | 80.7 | 42.1 | – |
| Human Semantic Understanding | 91.5 | 69.5 | – |
| 部署平台 | 英伟达Orin X | 端侧 | 端侧 |
| 核心定位 | 端侧智能体基座 | 端侧通用模型 | 端侧推理模型 |
Sage的应用场景
- 智能座舱交互: 用户通过自然语言发出复合指令,Sage一次性解析并联动空调、导航、音乐等多个车载系统完成服务闭环。
- 儿童安全守护: 后排传感器检测到儿童乘坐时,Sage主动触发儿童模式,自动锁定车窗、切换适龄内容并限制音量。
- 智能出行规划: 结合实时路况与用户需求,Sage主动推荐最优路线并在拥堵时提供备选方案,实现从被动响应到主动服务的转变。
- 舱驾一体服务: 作为舱驾融合方案的核心AI支撑,Sage打通座舱交互与驾驶感知,提供全场景智能体服务。
📝 站长洞察 (Editor’s Insight)
Sage的发布是端侧AI从‘模型小型化’迈向‘智能体化’的关键里程碑。其核心突破在于MoE架构下的效率革命:3B激活参数实现14倍于MiMo-v2-Pro的能效比,配合SCOUT与ERL技术将复杂任务训练成本降低60%、推理错误自动修正,这解决了端侧算力约束与智能体复杂任务执行间的根本矛盾。从行业视角看,它瞄准了智能座舱从‘功能堆砌’转向‘场景智能体’的趋势痛点,通过原生多模态与主动感知能力,为车企提供了真正的‘舱脑一体化’解决方案。更深层看,Sage的崛起或将加速云端智能向‘云-边-端’分层协同架构的演进,推动智能汽车的竞争重心从硬件配置转移到端侧AI智能体的落地能力上,这或许是中国AI公司差异化突围的又一范本。
