Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: RoboBrain – 智源研究院开源的具身大脑模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > RoboBrain – 智源研究院开源的具身大脑模型
AIGC 资讯

RoboBrain – 智源研究院开源的具身大脑模型

站外新闻
最近更新: 2026年6月8日 上午4:57
SHARE

RoboBrain是什么

RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。RoboBrain采用多阶段训练策略,具备长历史帧记忆和高分辨率图像感知能力,能将抽象指令映射为具体动作。在任务规划、可操作区域感知和轨迹预测等评测任务中均表现出色。

阅读目录
  • RoboBrain是什么
  • RoboBrain的主要功能
  • RoboBrain的技术原理
  • RoboBrain的项目地址
  • RoboBrain的应用场景

RoboBrain

RoboBrain的主要功能

  • 规划能力(Planning Capability):将复杂的操作指令分解为可管理的子任务。例如,将“提起茶壶并将水倒入杯中”分解为“靠近茶壶并提起”“移动茶壶使壶嘴对准杯口”和“倾斜茶壶倒水”等步骤。
  • 可操作性感知(Affordance Perception):识别和解释交互对象的可操作区域,如茶壶的把手或壶嘴。
  • 轨迹预测(Trajectory Prediction):预测完成操作所需的完整轨迹,如从当前位置到茶壶把手的运动轨迹。

RoboBrain的技术原理

  • 模型架构:RoboBrain基于LLaVA框架,由以下三个主要模块组成:
    • 视觉编码器(Visual Encoder):使用SigLIP模型,将输入图像编码为视觉特征。
    • 投影器(Projector):通过两层MLP将视觉特征映射到与文本嵌入相同的维度。
    • 大语言模型(LLM):采用Qwen2.5-7B-Instruct模型,用于理解和生成文本指令。
  • 多阶段训练策略:RoboBrain采用多阶段训练策略,提升其在机器人操作任务中的性能:
    • 通用视觉训练(OneVision Training):在大规模通用视觉数据集上进行预训练,以开发基础的视觉和语言理解能力。
    • 机器人任务训练:在ShareRobot数据集上进行微调,增强任务规划、可操作区域感知和轨迹预测能力。
  • 数据集支持:RoboBrain的训练依赖于ShareRobot数据集,是高质量的异构数据集,包含任务规划、物体可操作区域和末端执行器轨迹等多维度标注。数据集的多样性和准确性经过精心设计,支持模型在复杂任务中的表现。
  • 推理过程:在实际应用中,RoboBrain首先感知视觉输入,将输入指令分解为一系列可执行的子任务,然后执行可操作区域感知和轨迹预测。分步处理方式使模型能高效地将抽象指令转化为具体的机器人操作。

RoboBrain的项目地址

  • 项目官网:https://superrobobrain.github.io/
  • Github仓库:https://github.com/FlagOpen/RoboBrain
  • HuggingFace模型库:https://huggingface.co/BAAI/RoboBrain
  • arXiv技术论文:https://arxiv.org/pdf/2502.21257

RoboBrain的应用场景

  • 多机器人协作:RoboBrain作为跨本体具身大小脑协作框架RoboOS的核心大脑模型,能实现多个不同类型的机器人之间的高效协作。
  • 复杂任务规划:RoboBrain能将复杂的操作指令分解为可管理的子任务,例如“Water plants”(浇花)、“Put the pot in the drawer”(将花盆放入抽屉)、“Cluster blocks of the same color into different corners”(将同色积木聚集到不同角落)等任务,RoboBrain可以生成详细的规划步骤。
  • 可操作区域感知:RoboBrain能识别和解释交互对象的可操作区域,例如在“Cluster blocks of the same color into different corners”任务中,RoboBrain能识别不同颜色积木的可操作区域,规划出合理的操作路径。
  • 实时反馈与优化:RoboBrain结合RoboOS的端云协作能力,能实时接收执行反馈,根据环境变化动态调整策略,持续优化任务规划,提升鲁棒性。
重磅开源|Wall-OSS-0.5:国产具身大模型破解零样本部署难题,无需微调直驱真实机器人
国家发改委力挺!’蚂蚁阿福’用户破亿,AI+医疗普惠方案引爆行业
阿里通义Fun-ASR1.5重磅发布:单模型支持30语言+方言识别,MoE架构引领ASR新纪元
360亿美元史上最大芯片租赁!阿波罗黑石联手,为Anthropic豪购谷歌TPU
CloudDM:一站式开源数据库管控平台,30种数据源、54条SQL审核规则,企业级权限与脱敏能力全免费
分享
Email 复制链接 打印
Share
上一篇 HoloPart – 港大联合 VAST 开源生成完整可编辑部件的 3D 模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

HoloPart – 港大联合 VAST 开源生成完整可编辑部件的 3D 模型
AIGC 资讯
SpatialLM – 群核科技开源的空间理解多模态模型
AIGC 资讯
URM – 阿里妈妈推出的世界知识大模型
AIGC 资讯
Gemma 3n – 谷歌推出的端侧多模态AI模型
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

通义千问「拍照问健康」重大升级:AI圈图识异常、智能推理获三甲专家实测认可

站外新闻
AIGC AI健康助手 医学图像识别 通义千问
AI 工具AIGC 资讯

重磅!ChatGPT深度整合PowerPoint:用自然语言秒生幻灯片,AI办公自动化进入多模态全流程时代

站外新闻
AI办公自动化 chatgpt Microsoft PowerPoint openai 企业级AI
量子芯片科技感占位特色图
AI 工具AIGC 资讯

Gemini 3.5 生产环境严重失控:越权删光两万行代码并编造修复报告,AI 开发信任危机再升级

站外新闻
AI 安全 AIGC 风险 Gemini 3.5 代码越权 生产事故
AIGC 资讯

HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.