Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA
AI 工具AIGC 资讯

智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA

站外新闻
最近更新: 2026年5月25日 下午10:29
GO-2 LIBERO 具身智能 动作思维链 智元机器人
SHARE

💡 站外导读:当前,具身智能领域面临的核心瓶颈在于‘语义理解’与‘物理执行’之间的巨大鸿沟,导致机器人难以在真实复杂环境中稳定执行长程任务。智元机器人推出的GO-2基座大模型,正是为了攻克这一行业痛点。它不仅是一项技术突破,更标志着机器人智能从‘看懂’向‘稳定做好’的关键范式转变,预示着工业制造、商业服务等场景的大规模落地即将加速。

GO-2是什么

GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通”理解-规划-执行”链路,弥合语义与动作间的鸿沟。模型首创”动作思维链”直接在动作空间推理规划,结合”异步双系统”架构实现低频规划与高频执行的稳定协同。在LIBERO等多项基准测试中刷新SOTA,通过Genie Studio平台实现真实场景的持续学习与规模化落地,让机器人从”看懂”真正走向”稳定执行”。

阅读目录
  • GO-2是什么
  • GO-2的主要功能
  • GO-2的技术原理
  • 如何使用GO-2
  • GO-2的关键信息和使用要求
  • GO-2的核心优势
  • GO-2的同类竞品对比
  • GO-2的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GO-2

GO-2的主要功能

  • 动作思维链推理:在动作空间直接进行规划推理,生成结构化高层动作序列,将复杂任务拆解为有序步骤,实现”想清楚再做”。
  • 异步双系统执行:慢系统(低频)生成”意图流”规划,快系统(高频)实时跟踪执行并动态调整,确保规划被稳定兑现。
  • 语义-动作统一建模:打通视觉-语言-动作链路,弥合”理解”与”执行”间的鸿沟,使抽象指令精准转化为物理世界动作。
  • 闭环持续进化:依托Genie Studio平台,通过”预训练+后训练+数据闭环”架构,在真实交互中持续采集数据并在线优化模型。
  • 跨域零样本迁移:具备从仿真到真实环境的强泛化能力,无需重新训练适应新场景、新物体和新纹理。
  • 复杂任务执行:支持长程任务规划与精准物理交互(如抓取、放置、操作物体),在真实环境中保持稳定可靠的动作执行。

GO-2的技术原理

  •  动作思维链(Action Chain-of-Thought):传统具身模型通常直接从视觉-语言输入生成底层控制信号,将”理解”与”执行”压缩在同一时刻完成,导致规划与执行断层。GO-2引入动作思维链,显式模拟人类的认知过程:在执行动作前,先在内部形成清晰的动作计划。
  • 异步双系统架构
    • 慢系统(Semantic Planner):较低频率运行,负责持续生成并细化高层动作规划。它不输出一次性结果,而是以”意图流”形式提供持续约束,从宏观动作逐步细化到子动作,形成层次化的动作表示。
    • 快系统(Action Refiner):较高频率运行,持续接收慢系统的规划指导,结合实时视觉观测生成具体控制信号。执行过程并非简单复现规划,而是围绕规划进行实时对齐与局部修正——当桌面高度与预期不一致时自动调整手臂下探幅度,当物体摩擦特性变化时实时调整抓取力度。
  • 带噪声强制教学训练机制:为确保快系统在”接近正确但不完美”的规划条件下仍能保持稳定执行,GO-2在训练阶段引入带噪声的强制教学机制。在训练执行模块时,使用真实的高层动作序列作为条件,同时加入一定扰动以模拟规划误差,使模型具备在动态环境中持续跟随规划。
  • 整体技术闭环:上述组件形成完整链路:VLM与视觉编码器处理多模态输入 → 动作思维链在动作空间生成可执行规划 → 异步双系统确保规划被稳定兑现 → 执行数据回流至云端进行后训练,实现模型在真实环境中的持续进化。

如何使用GO-2

  • 平台接入部署:开发者需通过Genie Studio官网https://genie.agibot.com/geniestudio接入GO-2基座模型,无需本地配置复杂的训练环境即可直接调用模型能力。
  • 多模态任务输入:用时向系统输入自然语言指令和当前视觉观测数据,VLM模块会自动解析任务意图和理解场景信息。
  • 动作思维链规划:模型基于动作思维链在动作空间内进行推理规划,生成从宏观到微观的多层级结构化动作序列作为执行蓝图。
  • 异步双系统执行:异步双系统自动启动,慢系统用低频持续提供意图流指导,快系统用高频实时跟踪并结合视觉反馈动态调整执行细节。
  • 闭环持续进化:任务执行过程中系统自动采集真实交互数据,通过云端后训练机制持续优化模型参数,实现从仿真到真实场景的闭环进化。

GO-2的关键信息和使用要求

  • 全称:Genie Operator-2(GO-2)
  • 发布方:智元机器人
  • 定位:新一代具身智能基座大模型
  • 核心技术:动作思维链(在动作空间推理规划)+ 异步双系统(低频规划+高频执行)
  • 解决痛点:弥合”语义-运动鸿沟”,让机器人从”想得明白”到”做得稳定”
  • 性能指标:LIBERO 98.5%、LIBERO-Plus 86.6%、GenieSim真实环境82.9%,全面SOTA
  • 学术认可:CVPR 2026、ACL 2026双顶会接收
  • 部署形态:内置Genie Studio开发平台,支持云端后训练与数据闭环

GO-2的核心优势

  • 弥合鸿沟,实现知行合一:GO-2通过统一架构打通逻辑推理与精准动作执行的链路,彻底弥合传统机器人”高层理解”与”底层执行”之间的语义-运动鸿沟,实现真正的”知行合一”。
  • 首创动作思维链,显式推理规划:GO-2首创动作思维链机制,在动作空间内显式完成推理规划,将复杂任务拆解为结构化动作序列,使机器人从”边看边做”转变为”想清楚再做”,显著降低执行偏差。
  • 异步双系统,确保执行稳定:GO-2采用异步双系统架构,慢系统以低频持续生成”意图流”规划,快系统以高频实时跟随并结合视觉反馈动态调整,确保高层规划在真实扰动中始终被稳定执行。
  • 全面刷新SOTA,性能行业领先:GO-2在LIBERO(98.5%)、LIBERO-Plus(86.6%)、GenieSim真实环境(82.9%)等多项基准测试中全面刷新SOTA,显著超越GR00T、π0.5等主流模型。
  • 数据闭环进化,零样本强泛化:GO-2支持在真实场景中持续采集交互数据进行在线优化,并具备强零样本跨域迁移能力,在仅使用仿真数据训练的前提下于真实环境取得82.9%成功率。

GO-2的同类竞品对比

对比维度 GO-2(智元机器人) π0.5(Physical Intelligence) RT-2(Google DeepMind)
核心架构 动作思维链 + 异步双系统 流匹配(Flow Matching)架构 VLA端到端(基于PaLI-X)
规划方式 在动作空间显式推理,生成结构化高层动作序列 直接生成动作,无显式中间规划层 直接从像素和指令映射为动作标记
执行机制 异步双系统:慢系统低频提供”意图流”+快系统高频实时跟随修正 单一生成模型端到端同时完成理解与执行 端到端直接输出控制信号
关键优势 弥合语义-运动鸿沟,规划与执行强制对齐,真实场景稳定性强 互联网规模视觉-语言预训练,高频动作生成能力强 经典VLA先驱,架构简洁,端到端训练
主要局限 商业闭源,需配套智元硬件生态 规划与执行压缩在同一时刻,真实场景稳定性待提升 高层推理与底层控制断层,长程任务误差累积明显
LIBERO成功率 98.7% 96.9% 未公开/显著较低
GenieSim真实环境 82.9%(零样本迁移) 77.5% 通常低于60%
进化能力 支持数据闭环持续进化(预训练+后训练) 依赖离线静态数据 依赖离线静态数据

GO-2的应用场景

  • 工业制造场景:在工厂产线中,GO-2可驱动机器人完成零部件装配、质量检测、工具操作等精细化作业,通过数据闭环持续学习适应不同工位特性,实现从仿真训练到真实产线的零样本迁移,降低产线切换时的调试成本。
  • 商业服务场景:适用商超、酒店、写字楼等场所的导引、清洁、零售补货等服务,用其跨场景泛化能力,在无需针对每个门店重新采集数据的情况下,即可稳定适应不同的货架布局、光照条件和人流环境。
  • 物流仓储场景:支持分拣、搬运、码垛等重复性操作,异步双系统架构确保机器人在高速运动中仍能保持动作精准,避免因视觉偏差导致的抓偏或碰撞,同时通过持续数据采集优化对不同包裹形状和重量的适应能力。
  • 具身智能科研平台:作为基座模型,GO-2为高校和研究机构提供开箱即用的具身智能开发平台,研究者可通过Genie Studio快速部署模型进行算法验证、数据采集和二次开发,加速具身智能领域的学术研究和技术迭代。

📝 站长洞察 (Editor’s Insight)

GO-2的发布不仅是智元机器人的里程碑,更是具身智能领域的一个标志性节点。其‘动作思维链’与‘异步双系统’的架构创新,本质上是对‘感知-思考-执行’传统范式的系统性重构。这背后反映了一个前沿趋势:大模型的竞争已从单纯的‘认知智能’(理解世界)延伸到‘物理智能’(与世界交互)。GO-2通过构建从VLM到物理动作的端到端闭环,并强调在真实环境中的持续进化能力,为通往通用机器人(General-Purpose Robot)提供了一条极具可行性的技术路径。未来,拥有强大数据闭环和生态整合能力的玩家,将在这场‘具身智能’的马拉松中占据先机。

MCPHub – 一站式MCP服务器聚合平台
Zapt AI
Crawl4LLM – 清华和卡内基梅隆大学联合开源的智能爬虫系统
英伟达重磅押注:新加坡AI实验室剑指具身智能,重塑制造业未来
明略科技开源Mano-P 1.0:纯视觉GUI智能体模型,OSWorld霸榜,端侧本地部署重塑自动化
TAGGED:GO-2LIBERO具身智能动作思维链智元机器人
分享
Email 复制链接 打印
Share
上一篇 突破推理长度瓶颈!阿里通义FIPO算法实现Token级精准奖惩,纯RL训练超越o1-mini
下一篇 流光脑波AI大脑占位特色图 乔治·霍茨重磅警告:AI编程智能体或成软件行业最大代价,过度依赖是致命陷阱
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

腾讯混元2.0震撼发布:4060亿参数MoE架构大模型,256K上下文,国内推理能力登顶
AI 工具 AIGC 资讯
美团开源LongCat-Image:6B参数逼平闭源模型,8105汉字渲染+图像编辑全搞定
AI 工具
智谱GLM-4.6V多模态大模型开源:106B参数性能比肩235B,视觉工具调用引领AI Agent新范式
AI 工具 AIGC 资讯
蚂蚁集团开源Ming-Flash-Omni 2.0:100B参数全模态大模型,统一视觉、语音、图像生成的SOTA级AIGC引擎
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

恶意开发者滥用Claude生成超670个恶意npm包:AI成供应链攻击新武器,开源安全告急!

站外新闻
AI安全 Claude npm 供应链攻击 恶意软件
AIGC 资讯

Muyan-TTS – 开源文本转语音模型,零样本语音合成

站外新闻
AI 工具AIGC 资讯

优必选开源具身智能大模型Thinker:4B参数9项基准全球第一,工业场景准确率99.99%

站外新闻
优必选 具身智能 开源大模型 机器人 视觉语言大模型
AI 工具AIGC 资讯

COTA:超参数科技发布全球首款「白盒」游戏AI智能体,LLM驱动实现百毫秒响应与真人级战术决策

站外新闻
AIGC 大语言模型 思维链技术 游戏AI智能体 超参数科技
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 蚂蚁集团 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.