商汤绝影发布端侧智能体基座Sage：3B激活参数超越云端模型，重塑智能座舱

💡 站外导读：随着汽车智能化竞争进入下半场，智能座舱正从单一语音交互向全域主动服务进化，但传统云端AI面临延迟、隐私与网络依赖瓶颈。商汤绝影推出的端侧智能体基座Sage，以极致效率破解这一行业痛点——它在Orin X平台上以仅3B激活参数达成94%的PinchBench任务完成率，性能反超云端旗舰模型。这不仅标志着端侧AI首次在复杂任务上比肩云端，更预示着智能座舱将彻底摆脱网络枷锁，走向实时、安全、主动的智能体时代。

Sage是什么

Sage是商汤绝影推出的端侧多模态智能体基座大模型，采用MoE架构，总参数32B、激活参数仅3B，模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%，超越Claude-Opus-4.6、GPT-5.4等云端旗舰。Sage搭载SCOUT与ERL两项后训练技术，支持复合指令解析、多系统联动与主动感知，为智能座舱提供云端级Agent能力。

阅读目录

Sage是什么
Sage的主要功能
Sage的技术原理
如何使用Sage
Sage的关键信息和使用要求
Sage的核心优势
Sage的同类竞品对比
Sage的应用场景

📝 站长洞察 (Editor’s Insight)

Sage

Sage的主要功能

复合指令解析：支持一次性解析用户多意图复合指令，自动联动空调、导航、影音等车载系统完成任务闭环。
主动感知服务：结合传感器实时感知乘员状态与路况，主动触发儿童模式、路线调整等场景化服务。
多模态座舱理解：依托原生车载数据，实现座舱语义与视觉理解，精准识别车内环境与用户需求。
工具调用与任务闭环：支持长链路工具调用与多步推理，在τ2-bench基准上实现80分，具备真正的智能体执行能力。
端侧实时响应：Orin X平台首字响应约0.5秒，单Token延迟0.03秒，生成吞吐80 tk/s，无需依赖云端。

Sage的技术原理

MoE稀疏激活架构：总参数32B，激活参数仅3B，通过稀疏激活机制在端侧有限算力下实现高效推理。
SCOUT分级协同学习：采用”小模型探路、大模型吸收”的分级协同机制，在复杂任务训练中节省约60% GPU小时消耗。
ERL可擦除强化学习：模型自动识别推理链中的错误步骤并擦除重生成，阻断偏差扩散，复杂任务完成率提升20%。
一体化多模态架构：融合视觉、语言与传感器数据的原生训练体系，针对车载场景构建差异化理解能力。

如何使用Sage

模型现已在英伟达 Orin X 端侧平台实现部署。

Sage的关键信息和使用要求

模型架构： MoE架构，总参数32B，激活参数3B。
部署平台： 已在英伟达Orin X端侧平台实现部署。
评测成绩： PinchBench最佳任务完成率94%，超越Claude-Opus-4.6、GPT-5.4等主流模型。
硬件产品： 北京车展期间推出搭载Sage的SageBox。
适用对象： 主要面向车企、Tier 1供应商及端侧智能体开发者。
网络要求： 端侧部署，无需依赖云端网络连接即可运行。
框架兼容： 支持接入OpenClaw、Hermes等主流Agent框架。

Sage的核心优势

端侧性能领先：用3B激活参数在PinchBench上达到94%任务完成率，超越众多大参数云端旗舰模型。
极致效率比：相比MiMo-v2-Pro（激活42B），Sage激活算力仅为其1/14，显存占用约1/31，性能高出6.6个百分点。
训练成本优化：SCOUT技术节省约60%复杂任务训练GPU小时，降低模型后训练成本。
推理纠错能力：ERL技术实现推理过程中错误步骤的自动识别与擦除，从源头阻断任务失败。
原生车载数据优势：Human Semantic Understanding测试获91.5分，领先同级端侧模型32%，深度理解座舱场景。
量产可行性：已在Orin X平台验证部署，具备车规级量产条件。

Sage的同类竞品对比

对比维度	Sage	Google Gemma 4	MiMo-v2-Pro
发布方	商汤绝影	Google	小米
总参数量	32B	同量级端侧	超1T
激活参数量	3B	未披露	42B
PinchBench完成率	94%	83.9%	87.4%
MMLU Pro	75.8	69.2	–
GPQA Diamond	77.3	58.5	–
τ2-bench	80.7	42.1	–
Human Semantic Understanding	91.5	69.5	–
部署平台	英伟达Orin X	端侧	端侧
核心定位	端侧智能体基座	端侧通用模型	端侧推理模型

Sage的应用场景

智能座舱交互： 用户通过自然语言发出复合指令，Sage一次性解析并联动空调、导航、音乐等多个车载系统完成服务闭环。
儿童安全守护： 后排传感器检测到儿童乘坐时，Sage主动触发儿童模式，自动锁定车窗、切换适龄内容并限制音量。
智能出行规划： 结合实时路况与用户需求，Sage主动推荐最优路线并在拥堵时提供备选方案，实现从被动响应到主动服务的转变。
舱驾一体服务： 作为舱驾融合方案的核心AI支撑，Sage打通座舱交互与驾驶感知，提供全场景智能体服务。

📝 站长洞察 (Editor’s Insight)

Sage的发布是端侧AI从‘模型小型化’迈向‘智能体化’的关键里程碑。其核心突破在于MoE架构下的效率革命：3B激活参数实现14倍于MiMo-v2-Pro的能效比，配合SCOUT与ERL技术将复杂任务训练成本降低60%、推理错误自动修正，这解决了端侧算力约束与智能体复杂任务执行间的根本矛盾。从行业视角看，它瞄准了智能座舱从‘功能堆砌’转向‘场景智能体’的趋势痛点，通过原生多模态与主动感知能力，为车企提供了真正的‘舱脑一体化’解决方案。更深层看，Sage的崛起或将加速云端智能向‘云-边-端’分层协同架构的演进，推动智能汽车的竞争重心从硬件配置转移到端侧AI智能体的落地能力上，这或许是中国AI公司差异化突围的又一范本。

商汤绝影发布端侧智能体基座Sage：3B激活参数超越云端模型，重塑智能座舱

Sage是什么

Sage的主要功能

Sage的技术原理

如何使用Sage

Sage的关键信息和使用要求

Sage的核心优势

Sage的同类竞品对比

Sage的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

2026年3月美国AI榜单巨变：Claude单月狂飙130%紧追ChatGPT，格局突变信号已现

得物实战揭秘：AI Coding工具如何突破数仓开发’失忆’痛点，Harness工程引领新范式

历史性和解！Meta妥协规避审判，美国首例学校诉社交媒体成瘾案落幕，揭示行业司法风向

Spotify与环球音乐联手：AI翻唱混音工具上线，正版版权终结Suno野蛮生长

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

Sage是什么

Sage的主要功能

Sage的技术原理

如何使用Sage

Sage的关键信息和使用要求

Sage的核心优势

Sage的同类竞品对比

Sage的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复