Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA
AI 工具AIGC 资讯

智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA

站外新闻
最近更新: 2026年5月25日 下午10:29
GO-2 LIBERO 具身智能 动作思维链 智元机器人
SHARE

💡 站外导读:当前,具身智能领域面临的核心瓶颈在于‘语义理解’与‘物理执行’之间的巨大鸿沟,导致机器人难以在真实复杂环境中稳定执行长程任务。智元机器人推出的GO-2基座大模型,正是为了攻克这一行业痛点。它不仅是一项技术突破,更标志着机器人智能从‘看懂’向‘稳定做好’的关键范式转变,预示着工业制造、商业服务等场景的大规模落地即将加速。

GO-2是什么

GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通”理解-规划-执行”链路,弥合语义与动作间的鸿沟。模型首创”动作思维链”直接在动作空间推理规划,结合”异步双系统”架构实现低频规划与高频执行的稳定协同。在LIBERO等多项基准测试中刷新SOTA,通过Genie Studio平台实现真实场景的持续学习与规模化落地,让机器人从”看懂”真正走向”稳定执行”。

阅读目录
  • GO-2是什么
  • GO-2的主要功能
  • GO-2的技术原理
  • 如何使用GO-2
  • GO-2的关键信息和使用要求
  • GO-2的核心优势
  • GO-2的同类竞品对比
  • GO-2的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GO-2

GO-2的主要功能

  • 动作思维链推理:在动作空间直接进行规划推理,生成结构化高层动作序列,将复杂任务拆解为有序步骤,实现”想清楚再做”。
  • 异步双系统执行:慢系统(低频)生成”意图流”规划,快系统(高频)实时跟踪执行并动态调整,确保规划被稳定兑现。
  • 语义-动作统一建模:打通视觉-语言-动作链路,弥合”理解”与”执行”间的鸿沟,使抽象指令精准转化为物理世界动作。
  • 闭环持续进化:依托Genie Studio平台,通过”预训练+后训练+数据闭环”架构,在真实交互中持续采集数据并在线优化模型。
  • 跨域零样本迁移:具备从仿真到真实环境的强泛化能力,无需重新训练适应新场景、新物体和新纹理。
  • 复杂任务执行:支持长程任务规划与精准物理交互(如抓取、放置、操作物体),在真实环境中保持稳定可靠的动作执行。

GO-2的技术原理

  •  动作思维链(Action Chain-of-Thought):传统具身模型通常直接从视觉-语言输入生成底层控制信号,将”理解”与”执行”压缩在同一时刻完成,导致规划与执行断层。GO-2引入动作思维链,显式模拟人类的认知过程:在执行动作前,先在内部形成清晰的动作计划。
  • 异步双系统架构
    • 慢系统(Semantic Planner):较低频率运行,负责持续生成并细化高层动作规划。它不输出一次性结果,而是以”意图流”形式提供持续约束,从宏观动作逐步细化到子动作,形成层次化的动作表示。
    • 快系统(Action Refiner):较高频率运行,持续接收慢系统的规划指导,结合实时视觉观测生成具体控制信号。执行过程并非简单复现规划,而是围绕规划进行实时对齐与局部修正——当桌面高度与预期不一致时自动调整手臂下探幅度,当物体摩擦特性变化时实时调整抓取力度。
  • 带噪声强制教学训练机制:为确保快系统在”接近正确但不完美”的规划条件下仍能保持稳定执行,GO-2在训练阶段引入带噪声的强制教学机制。在训练执行模块时,使用真实的高层动作序列作为条件,同时加入一定扰动以模拟规划误差,使模型具备在动态环境中持续跟随规划。
  • 整体技术闭环:上述组件形成完整链路:VLM与视觉编码器处理多模态输入 → 动作思维链在动作空间生成可执行规划 → 异步双系统确保规划被稳定兑现 → 执行数据回流至云端进行后训练,实现模型在真实环境中的持续进化。

如何使用GO-2

  • 平台接入部署:开发者需通过Genie Studio官网https://genie.agibot.com/geniestudio接入GO-2基座模型,无需本地配置复杂的训练环境即可直接调用模型能力。
  • 多模态任务输入:用时向系统输入自然语言指令和当前视觉观测数据,VLM模块会自动解析任务意图和理解场景信息。
  • 动作思维链规划:模型基于动作思维链在动作空间内进行推理规划,生成从宏观到微观的多层级结构化动作序列作为执行蓝图。
  • 异步双系统执行:异步双系统自动启动,慢系统用低频持续提供意图流指导,快系统用高频实时跟踪并结合视觉反馈动态调整执行细节。
  • 闭环持续进化:任务执行过程中系统自动采集真实交互数据,通过云端后训练机制持续优化模型参数,实现从仿真到真实场景的闭环进化。

GO-2的关键信息和使用要求

  • 全称:Genie Operator-2(GO-2)
  • 发布方:智元机器人
  • 定位:新一代具身智能基座大模型
  • 核心技术:动作思维链(在动作空间推理规划)+ 异步双系统(低频规划+高频执行)
  • 解决痛点:弥合”语义-运动鸿沟”,让机器人从”想得明白”到”做得稳定”
  • 性能指标:LIBERO 98.5%、LIBERO-Plus 86.6%、GenieSim真实环境82.9%,全面SOTA
  • 学术认可:CVPR 2026、ACL 2026双顶会接收
  • 部署形态:内置Genie Studio开发平台,支持云端后训练与数据闭环

GO-2的核心优势

  • 弥合鸿沟,实现知行合一:GO-2通过统一架构打通逻辑推理与精准动作执行的链路,彻底弥合传统机器人”高层理解”与”底层执行”之间的语义-运动鸿沟,实现真正的”知行合一”。
  • 首创动作思维链,显式推理规划:GO-2首创动作思维链机制,在动作空间内显式完成推理规划,将复杂任务拆解为结构化动作序列,使机器人从”边看边做”转变为”想清楚再做”,显著降低执行偏差。
  • 异步双系统,确保执行稳定:GO-2采用异步双系统架构,慢系统以低频持续生成”意图流”规划,快系统以高频实时跟随并结合视觉反馈动态调整,确保高层规划在真实扰动中始终被稳定执行。
  • 全面刷新SOTA,性能行业领先:GO-2在LIBERO(98.5%)、LIBERO-Plus(86.6%)、GenieSim真实环境(82.9%)等多项基准测试中全面刷新SOTA,显著超越GR00T、π0.5等主流模型。
  • 数据闭环进化,零样本强泛化:GO-2支持在真实场景中持续采集交互数据进行在线优化,并具备强零样本跨域迁移能力,在仅使用仿真数据训练的前提下于真实环境取得82.9%成功率。

GO-2的同类竞品对比

对比维度 GO-2(智元机器人) π0.5(Physical Intelligence) RT-2(Google DeepMind)
核心架构 动作思维链 + 异步双系统 流匹配(Flow Matching)架构 VLA端到端(基于PaLI-X)
规划方式 在动作空间显式推理,生成结构化高层动作序列 直接生成动作,无显式中间规划层 直接从像素和指令映射为动作标记
执行机制 异步双系统:慢系统低频提供”意图流”+快系统高频实时跟随修正 单一生成模型端到端同时完成理解与执行 端到端直接输出控制信号
关键优势 弥合语义-运动鸿沟,规划与执行强制对齐,真实场景稳定性强 互联网规模视觉-语言预训练,高频动作生成能力强 经典VLA先驱,架构简洁,端到端训练
主要局限 商业闭源,需配套智元硬件生态 规划与执行压缩在同一时刻,真实场景稳定性待提升 高层推理与底层控制断层,长程任务误差累积明显
LIBERO成功率 98.7% 96.9% 未公开/显著较低
GenieSim真实环境 82.9%(零样本迁移) 77.5% 通常低于60%
进化能力 支持数据闭环持续进化(预训练+后训练) 依赖离线静态数据 依赖离线静态数据

GO-2的应用场景

  • 工业制造场景:在工厂产线中,GO-2可驱动机器人完成零部件装配、质量检测、工具操作等精细化作业,通过数据闭环持续学习适应不同工位特性,实现从仿真训练到真实产线的零样本迁移,降低产线切换时的调试成本。
  • 商业服务场景:适用商超、酒店、写字楼等场所的导引、清洁、零售补货等服务,用其跨场景泛化能力,在无需针对每个门店重新采集数据的情况下,即可稳定适应不同的货架布局、光照条件和人流环境。
  • 物流仓储场景:支持分拣、搬运、码垛等重复性操作,异步双系统架构确保机器人在高速运动中仍能保持动作精准,避免因视觉偏差导致的抓偏或碰撞,同时通过持续数据采集优化对不同包裹形状和重量的适应能力。
  • 具身智能科研平台:作为基座模型,GO-2为高校和研究机构提供开箱即用的具身智能开发平台,研究者可通过Genie Studio快速部署模型进行算法验证、数据采集和二次开发,加速具身智能领域的学术研究和技术迭代。

📝 站长洞察 (Editor’s Insight)

GO-2的发布不仅是智元机器人的里程碑,更是具身智能领域的一个标志性节点。其‘动作思维链’与‘异步双系统’的架构创新,本质上是对‘感知-思考-执行’传统范式的系统性重构。这背后反映了一个前沿趋势:大模型的竞争已从单纯的‘认知智能’(理解世界)延伸到‘物理智能’(与世界交互)。GO-2通过构建从VLM到物理动作的端到端闭环,并强调在真实环境中的持续进化能力,为通往通用机器人(General-Purpose Robot)提供了一条极具可行性的技术路径。未来,拥有强大数据闭环和生态整合能力的玩家,将在这场‘具身智能’的马拉松中占据先机。

AI赋能“一人公司”革命:漳州“单人成军”模式如何颠覆数字贸易创业?
Poe AI
Langdock
ChatBuddy AI个人助理
Ordinary People Prompts
TAGGED:GO-2LIBERO具身智能动作思维链智元机器人
分享
Email 复制链接 打印
Share
上一篇 突破推理长度瓶颈!阿里通义FIPO算法实现Token级精准奖惩,纯RL训练超越o1-mini
下一篇 流光脑波AI大脑占位特色图 乔治·霍茨重磅警告:AI编程智能体或成软件行业最大代价,过度依赖是致命陷阱
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

全息流体渐变通用占位特色图
全球AI监管转向:多国强推『上线前安检』,大模型安全评估新机制如何落地?
AIGC 资讯
流光脑波AI大脑占位特色图
乔治·霍茨重磅警告:AI编程智能体或成软件行业最大代价,过度依赖是致命陷阱
AIGC 资讯 最新趋势
突破推理长度瓶颈!阿里通义FIPO算法实现Token级精准奖惩,纯RL训练超越o1-mini
AI 工具 AIGC 资讯
AI支付革命:蚂蚁集团CEO韩歆毅发布全球首个Token Pay,定义智能体经济新基建
AIGC 资讯 最新趋势

相关推荐

AI 工具

EasyDiffusion Online

remaker
AI 工具

Sivi AI

remaker
AI 工具

Salee

remaker
AI 工具AIGC 资讯

MiniMax Music 2.6深度评测:20秒极速生成、14种结构控制,AI音乐创作进入可控时代

站外新闻
AI Agent AIGC AI音乐生成 MiniMax 音乐大模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI安全 AI工具 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos DALL-E3 DeepSeek Gemini GPT-5.5 meta Midjourney MoE MoE架构 MoE模型 NVIDIA openai Pika prompt Qwen3.7-Max stable diffusion SWE-Bench Token Pay xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 办公自动化 华为昇腾 咒语 商汤科技 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 女性 字节跳动 室内设计 家居 展台 建筑 建筑设计 开发者工具 开源 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 提示词 支付宝 教程 新加坡 新闻 早报 智能体 智能体编程 月之暗面 海报设计 游戏 生成式AI 破碎 科幻 窗 端侧AI 网络安全 背景 腾讯混元 英伟达 视频编辑 语音合成 赛博朋克 运动 阶跃星辰 阿里通义 阿里通义千问 风景 马斯克
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.