Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读:
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 >
AI 工具AIGC 资讯

站外新闻
最近更新: 2026年6月7日 下午8:18
上海人工智能实验室 具身智能 双系统架构 操作大模型 机器人操作
SHARE

💡 站外导读:随着具身智能从实验室走向产业应用,如何让机器人在复杂真实环境中精准理解指令、规划动作并持续学习,成为行业核心痛点。传统方法往往面临训练成本高昂、泛化能力不足、长程任务表现不佳等挑战。上海AI Lab开源的InternVLA·M1,以其创新的双系统架构与闭环学习范式,正为破解这些难题提供新思路。

InternVLA·M1是什么

InternVLA·M1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策略,先通过空间感知预训练,增强空间推理与规划能力;再以隐式空间推理方式实现高效的动作后训练。仅需“空间规划提示”即可高效训练,大幅降低成本。在 SimplerEnv 等公开操作基准测试中,InternVLA·M1 达到国际领先水平,其指令跟随与未见物体泛化能力显著优于其他同类模型。依托自研仿真平台 InternData-M1 完成大规模预训练,适用于复杂场景及长程任务。

阅读目录
  • InternVLA·M1是什么
  • InternVLA·M1的主要功能
  • InternVLA·M1的技术原理
  • InternVLA·M1的项目地址
  • InternVLA·M1的应用场景
      • 📝 站长洞察 (Editor’s Insight)

InternVLA·M1

InternVLA·M1的主要功能

  • 高阶空间推理与任务规划:负责复杂环境下的空间推理和任务规划,能理解指令并生成相应的操作序列。
  • 双系统操作架构:采用两阶段训练策略,先进行空间感知预训练,再进行动作后训练,提升模型的推理和规划能力。
  • 高效训练与成本控制:通过“空间规划提示”实现高效训练,大幅降低训练成本和时间。
  • 指令跟随与泛化能力:在多种公开基准测试中表现优异,尤其在指令跟随和未见物体泛化方面表现突出。
  • 自主学习与闭环控制:构建了“思考-行动-自主学习”的完整闭环,能够通过自主学习不断优化操作策略。
  • 复杂场景适应性:在真机复杂场景及长程任务中表现出色,适用于多种实际应用场景。

InternVLA·M1的技术原理

  • 双系统架构:结合空间感知预训练和动作后训练,增强模型对空间环境的理解和操作能力。
  • 空间感知预训练:通过大规模仿真数据,训练模型对空间关系的感知和推理能力,为后续任务规划奠定基础。
  • 动作后训练:利用隐式空间推理方式,使模型能高效地学习具体动作的执行,提升操作精度。
  • 空间规划提示:引入空间规划提示机制,帮助模型更高效地进行任务规划和动作生成,降低训练复杂度。
  • 闭环控制:构建“思考-行动-自主学习”的闭环系统,使模型能在实际操作中不断学习和优化,适应复杂环境。
  • 大规模仿真数据:依托自研仿真平台 InternData-M1,生成大量高质量的训练数据,支持模型的大规模预训练。
  • 指令驱动:模型能接收自然语言指令,解析指令内容,生成相应的操作序列,实现指令跟随功能。

InternVLA·M1的项目地址

  • 项目官网:https://internrobotics.github.io/internvla-m1.github.io/
  • Github仓库:https://github.com/InternRobotics/InternVLA-M1
  • HuggingFace模型库:https://huggingface.co/collections/InternRobotics/internvla-m1-68c96eaebcb5867786ee6cf3
  • HuggingFace数据链接:https://huggingface.co/datasets/InternRobotics/InternData-M1
  • 技术论文:https://github.com/InternRobotics/InternVLA-M1/blob/InternVLA-M1/assets/InternVLA_M1.pdf

InternVLA·M1的应用场景

  • 工业自动化:在工厂环境中,用于自动化生产线上的复杂任务,如零部件组装、物料搬运和质量检测,提高生产效率和精准度。
  • 物流与仓储:优化物流中心的货物分拣、搬运和存储操作,实现自动化仓库管理,提升物流效率和准确性。
  • 服务机器人:在家庭、酒店、医院等场景中,为人们提供清洁、送餐、护理等服务,提升生活质量和服务效率。
  • 智能安防:用于安防监控中的异常行为检测、区域巡逻和安全检查,增强安防系统的智能化水平。
  • 教育与科研:作为教学和科研工具,帮助学生和研究人员探索机器人技术、人工智能和自动化控制等领域。
  • 灾难救援:在地震、火灾等灾害现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。
  • 农业自动化:用于农作物种植、采摘和灌溉等环节,实现农业生产的自动化和智能化,提高农业生产力。

📝 站长洞察 (Editor’s Insight)

InternVLA·M1的发布,标志着具身智能大模型正从“感知-执行”向“推理-规划-学习”的更高阶段跃迁。其双系统架构极具前瞻性:System 1负责快速响应与动作执行,System 2专注高阶推理与任务规划,这种分而治之的思路与人类认知高度契合,是提升复杂任务泛化性的关键。更值得关注的是其“空间规划提示”与仿真数据协同的训练范式,这直接命中了当前具身智能领域最大的瓶颈——高质量、规模化数据获取与成本控制。在产业层面,该模型为工业自动化、物流、服务机器人等场景提供了更“聪明”且可落地的大脑,加速了AI从虚拟走向物理世界的进程。未来,结合更强大的基础模型与具身数据飞轮,我们有望看到真正具备环境自适应与自主进化能力的通用机器智能体。

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
Cobra – 清华、港中文和腾讯开源的漫画线稿上色框架
Mini-InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型
Glass.health
TalkCody开源AI编程助手评测:50+大模型一键切换,本地隐私保护重塑开发者工作流
TAGGED:上海人工智能实验室具身智能双系统架构操作大模型机器人操作
分享
Email 复制链接 打印
Share
上一篇 阿里通义开源WebResearcher:迭代式深度研究Agent,自主拆解复杂问题的AI研究助手
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

阿里通义开源WebResearcher:迭代式深度研究Agent,自主拆解复杂问题的AI研究助手
AI 工具 AIGC 资讯
阿里通义发布Qwen3Guard:全球首款支持119种语言的大模型安全防护标杆
AI 工具 AIGC 资讯
AntSK FileChunk开源工具:基于AI语义分析的智能文档切片,彻底告别传统分割的语义割裂
AI 工具
上海AI Lab开源XTuner V1:支持1T参数MoE模型训练,显存吞吐双杀传统方案
AI 工具 AIGC 资讯

相关推荐

AI 工具

AIGCPanel 2.0重磅发布:工作流引擎+CLI工具,一键自动化生产数字人视频

站外新闻
AIGCPanel CLI工具 工作流引擎 数字人创作
AIGC 资讯

Wall-OSS-0.5 – 自变量机器人开源的国产具身智能模型

站外新闻
AI 工具

通义万相

remaker
AI 工具

Perplexity Labs LLaMa Chat

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.