Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 商汤绝影发布端侧智能体基座Sage:3B激活参数超越云端模型,重塑智能座舱
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 商汤绝影发布端侧智能体基座Sage:3B激活参数超越云端模型,重塑智能座舱
AI 工具AIGC 资讯

商汤绝影发布端侧智能体基座Sage:3B激活参数超越云端模型,重塑智能座舱

站外新闻
最近更新: 2026年5月24日 上午2:30
MoE架构 商汤绝影 智能体 智能座舱 端侧大模型
SHARE

💡 站外导读:随着汽车智能化竞争进入下半场,智能座舱正从单一语音交互向全域主动服务进化,但传统云端AI面临延迟、隐私与网络依赖瓶颈。商汤绝影推出的端侧智能体基座Sage,以极致效率破解这一行业痛点——它在Orin X平台上以仅3B激活参数达成94%的PinchBench任务完成率,性能反超云端旗舰模型。这不仅标志着端侧AI首次在复杂任务上比肩云端,更预示着智能座舱将彻底摆脱网络枷锁,走向实时、安全、主动的智能体时代。

Sage是什么

Sage是商汤绝影推出的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%,超越Claude-Opus-4.6、GPT-5.4等云端旗舰。Sage搭载SCOUT与ERL两项后训练技术,支持复合指令解析、多系统联动与主动感知,为智能座舱提供云端级Agent能力。

阅读目录
  • Sage是什么
  • Sage的主要功能
  • Sage的技术原理
  • 如何使用Sage
  • Sage的关键信息和使用要求
  • Sage的核心优势
  • Sage的同类竞品对比
  • Sage的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Sage

Sage的主要功能

  • 复合指令解析:支持一次性解析用户多意图复合指令,自动联动空调、导航、影音等车载系统完成任务闭环。
  • 主动感知服务:结合传感器实时感知乘员状态与路况,主动触发儿童模式、路线调整等场景化服务。
  • 多模态座舱理解:依托原生车载数据,实现座舱语义与视觉理解,精准识别车内环境与用户需求。
  • 工具调用与任务闭环:支持长链路工具调用与多步推理,在τ2-bench基准上实现80分,具备真正的智能体执行能力。
  • 端侧实时响应:Orin X平台首字响应约0.5秒,单Token延迟0.03秒,生成吞吐80 tk/s,无需依赖云端。

Sage的技术原理

  • MoE稀疏激活架构:总参数32B,激活参数仅3B,通过稀疏激活机制在端侧有限算力下实现高效推理。
  • SCOUT分级协同学习:采用”小模型探路、大模型吸收”的分级协同机制,在复杂任务训练中节省约60% GPU小时消耗。
  • ERL可擦除强化学习:模型自动识别推理链中的错误步骤并擦除重生成,阻断偏差扩散,复杂任务完成率提升20%。
  • 一体化多模态架构:融合视觉、语言与传感器数据的原生训练体系,针对车载场景构建差异化理解能力。

如何使用Sage

模型现已在英伟达 Orin X 端侧平台实现部署。

Sage的关键信息和使用要求

  • 模型架构: MoE架构,总参数32B,激活参数3B。
  • 部署平台: 已在英伟达Orin X端侧平台实现部署。
  • 评测成绩: PinchBench最佳任务完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
  • 硬件产品: 北京车展期间推出搭载Sage的SageBox。
  • 适用对象: 主要面向车企、Tier 1供应商及端侧智能体开发者。
  • 网络要求: 端侧部署,无需依赖云端网络连接即可运行。
  • 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。

Sage的核心优势

  • 端侧性能领先:用3B激活参数在PinchBench上达到94%任务完成率,超越众多大参数云端旗舰模型。
  • 极致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力仅为其1/14,显存占用约1/31,性能高出6.6个百分点。
  • 训练成本优化:SCOUT技术节省约60%复杂任务训练GPU小时,降低模型后训练成本。
  • 推理纠错能力:ERL技术实现推理过程中错误步骤的自动识别与擦除,从源头阻断任务失败。
  • 原生车载数据优势:Human Semantic Understanding测试获91.5分,领先同级端侧模型32%,深度理解座舱场景。
  • 量产可行性:已在Orin X平台验证部署,具备车规级量产条件。

Sage的同类竞品对比

对比维度 Sage Google Gemma 4 MiMo-v2-Pro
发布方 商汤绝影 Google 小米
总参数量 32B 同量级端侧 超1T
激活参数量 3B 未披露 42B
PinchBench完成率 94% 83.9% 87.4%
MMLU Pro 75.8 69.2 –
GPQA Diamond 77.3 58.5 –
τ2-bench 80.7 42.1 –
Human Semantic Understanding 91.5 69.5 –
部署平台 英伟达Orin X 端侧 端侧
核心定位 端侧智能体基座 端侧通用模型 端侧推理模型

Sage的应用场景

  • 智能座舱交互: 用户通过自然语言发出复合指令,Sage一次性解析并联动空调、导航、音乐等多个车载系统完成服务闭环。
  • 儿童安全守护: 后排传感器检测到儿童乘坐时,Sage主动触发儿童模式,自动锁定车窗、切换适龄内容并限制音量。
  • 智能出行规划: 结合实时路况与用户需求,Sage主动推荐最优路线并在拥堵时提供备选方案,实现从被动响应到主动服务的转变。
  • 舱驾一体服务: 作为舱驾融合方案的核心AI支撑,Sage打通座舱交互与驾驶感知,提供全场景智能体服务。

📝 站长洞察 (Editor’s Insight)

Sage的发布是端侧AI从‘模型小型化’迈向‘智能体化’的关键里程碑。其核心突破在于MoE架构下的效率革命:3B激活参数实现14倍于MiMo-v2-Pro的能效比,配合SCOUT与ERL技术将复杂任务训练成本降低60%、推理错误自动修正,这解决了端侧算力约束与智能体复杂任务执行间的根本矛盾。从行业视角看,它瞄准了智能座舱从‘功能堆砌’转向‘场景智能体’的趋势痛点,通过原生多模态与主动感知能力,为车企提供了真正的‘舱脑一体化’解决方案。更深层看,Sage的崛起或将加速云端智能向‘云-边-端’分层协同架构的演进,推动智能汽车的竞争重心从硬件配置转移到端侧AI智能体的落地能力上,这或许是中国AI公司差异化突围的又一范本。

BetterPic
ElevenLabs
GPT Prompt Engineer
开源AI Agent反检测浏览器:Camofox Browser如何用C++级指纹伪造突破Cloudflare封锁
火龙果写作Pitaya
TAGGED:MoE架构商汤绝影智能体智能座舱端侧大模型
分享
Email 复制链接 打印
Share
上一篇 开源buffett-skills:用Claude Code复现巴菲特决策框架,AI一键生成10章节投资分析报告
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

开源buffett-skills:用Claude Code复现巴菲特决策框架,AI一键生成10章节投资分析报告
AI 工具
港中文开源OpenGame框架:端到端生成可玩网页游戏,揭秘AI游戏开发新范式
AI 工具 AIGC 资讯
阿里Qwen3.6-27B开源!270亿参数碾压万亿级MoE,编程+多模态全能型大模型深度解析
AI 工具 AIGC 资讯
OpenAI重磅开源隐私过滤模型:本地运行、支持128K长文本的PII脱敏新方案
AI 工具 AIGC 资讯

相关推荐

AI 工具

TweetStorm AI

remaker
AI 工具

ClipDrop

remaker
AI 工具AIGC 资讯

阿里通义Qwen3.7-Max旗舰大模型发布:全能智能体基座,编程推理全面领先,定义AI Agent新标杆

站外新闻
AI编程 Qwen3.7-Max 大模型 智能体 阿里通义千问
AI 工具

Flo

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AI Agent AIGC AI工具 AI智能体 AI生成内容 AI绘画 AI编程 AI编程工具 AI视频 AI设计 Anthropic chatgpt Claude Claude Code DALL-E3 DeepSeek Gemini GPT-5.5 meta Midjourney MoE架构 NVIDIA openai Pika prompt runway Stability AI stable diffusion 世界模型 丛林 乐高 人像 人工智能 人物 具身智能 办公自动化 动物 咒语 图像生成模型 多模态 多模态大模型 大模型 大模型API 大语言模型 女性 字节跳动 室内设计 家居 局部重绘 展台 帅哥 建筑 建筑设计 开发者工具 开源 开源工具 开源平台 开源框架 开源模型 强化学习 微摄影 微软 怪物 提示词 摄影 教程 新加坡 新闻 日本排放核污水 早报 智能体 水果 海报设计 清华大学 游戏 游戏美术 玻璃 破碎 科幻 窗 美食 背景 腾讯混元 芭比 花 英伟达 苹果 视频编辑 赛博朋克 超现实主义 运动 阶跃星辰 阿里通义 阿里通义千问 风景 食物 香水 马斯克
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.