Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 上海AI Lab重磅开源:InternVLA·N1双系统导航大模型,纯合成数据训练,实现真实场景跨楼宇导航
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 上海AI Lab重磅开源:InternVLA·N1双系统导航大模型,纯合成数据训练,实现真实场景跨楼宇导航
AI 工具AIGC 资讯

上海AI Lab重磅开源:InternVLA·N1双系统导航大模型,纯合成数据训练,实现真实场景跨楼宇导航

站外新闻
最近更新: 2026年6月7日 下午8:18
上海人工智能实验室 导航 机器人 端到端
SHARE

💡 站外导读:当前,机器人与自动驾驶领域的导航系统仍面临指令理解、长程规划与实时避障的协同难题。传统方法依赖大量真实数据采集,成本高昂且泛化能力有限。上海人工智能实验室开源的InternVLA·N1,通过独特的“双系统”架构与纯合成数据训练范式,首次在单一模型中实现了语言理解、长程规划与高频敏捷避障的端到端融合,为低成本、高适应性的智能导航提供了全新路径。

InternVLA·N1是什么

InternVLA·N1是上海人工智能实验室开源的端到端双系统导航大模型。采用双系统架构,系统2负责理解语言指令并规划长程路径,系统1专注于高频响应和敏捷避障。模型完全基于合成数据训练,通过大规模数字场景资产和海量多模态语料,实现了低成本高效率的训练过程。在多个主流基准测试中,InternVLA·N1表现出色,得分达到国际领先水平,展现了强大的零样本泛化能力。能实现在真实场景中的“跨楼宇长距离”听令行走和密集障碍物间的敏捷避障。

阅读目录
  • InternVLA·N1是什么
  • InternVLA·N1的主要功能
  • InternVLA·N1的技术原理
  • InternVLA·N1的项目地址
  • InternVLA·N1的应用场景
      • 📝 站长洞察 (Editor’s Insight)

InternVLA·N1

InternVLA·N1的主要功能

  • 语言理解与路径规划:系统2能理解自然语言指令,根据视觉观测在图像上预测下一步执行的目标像素,实现长程空间推理规划。
  • 敏捷避障与执行:系统1负责高频响应环境变化,实现敏捷避障,确保能准确到达目标点。
  • 合成数据驱动训练:完全基于合成数据进行训练,通过大规模数字场景资产和海量多模态语料,实现低成本高效率的训练过程。
  • 零样本泛化能力:仅使用合成数据训练,却能在真实场景中实现60Hz的“跨楼宇长距离”听令行走和密集障碍物间的敏捷避障,展现出强大的泛化能力。
  • 多场景适应性:在多个主流基准测试中表现出色,得分达到国际领先水平,适用于多种复杂场景和任务需求。

InternVLA·N1的技术原理

  • 双系统架构:采用系统1和系统2的双系统架构,系统2负责理解语言指令并进行长程空间推理规划,系统1则专注于高频响应和敏捷避障,二者协同工作实现高效导航。
  • 异步推理机制:系统1和系统2异步推理,系统1可以更频繁地响应环境变化,实现敏捷避障,而系统2则专注于长程空间推理规划,避免了同步推理带来的延迟和复杂性。
  • 纯合成数据驱动:完全基于合成数据进行训练,通过大规模数字场景资产和海量多模态语料,结合高效的数据合成技术,实现低成本高效率的训练。
  • 两阶段课程训练:训练分为预训练阶段和联调阶段,预训练阶段对系统2进行监督微调,使其能准确规划路径;联调阶段则让系统1和系统2协同工作,优化整体导航性能。
  • 多模态融合:模型能融合视觉和语言信息,通过多模态大模型实现对复杂环境的理解和导航任务的执行,提升了模型在真实场景中的适应性和准确性。

InternVLA·N1的项目地址

  • 项目官网:https://internrobotics.github.io/internvla-n1.github.io/
  • GitHub仓库:https://github.com/InternRobotics/InternNav
  • Hugging Face模型库:https://huggingface.co/InternRobotics/InternVLA-N1
  • 技术论文:https://internrobotics.github.io/internvla-n1.github.io/static/pdfs/InternVLA_N1.pdf

InternVLA·N1的应用场景

  • 智能机器人导航:为服务机器人、物流机器人等提供高效导航能力,能根据语音指令在复杂环境中自主行走、避障并完成任务。
  • 自动驾驶辅助:在自动驾驶领域,辅助车辆进行路径规划和障碍物避让,提升自动驾驶系统的安全性和可靠性。
  • 虚拟现实与增强现实:在虚拟现实(VR)和增强现实(AR)应用中,为用户提供更加自然和沉浸式的交互体验,例如在虚拟环境中根据语音指令导航。
  • 智能安防监控:在智能安防领域,通过视觉和语言指令的融合,实现对监控区域的智能巡逻和异常事件的快速响应。
  • 工业自动化:在工业环境中,为自动化设备提供导航和操作指导,提高生产效率和安全性。
  • 智能导览服务:在博物馆、展览馆等场所,为游客提供个性化的导航和讲解服务,提升参观体验。

📝 站长洞察 (Editor’s Insight)

InternVLA·N1的发布,标志着具身智能从“感知-决策”分离范式向“理解-执行”端到端闭环的关键跃迁。其“系统1-系统2”架构借鉴了认知科学理论,让慢思考(规划)与快思考(反应)解耦并行,这可能是解决复杂动态环境中实时性瓶颈的有效思路。更值得关注的是其“纯合成数据驱动”路线,这直击了行业数据采集成本高昂的痛点,结合大规模数字场景资产,为模型的规模化、低成本迭代开辟了高速通道。尽管真实场景的“最后一公里”挑战犹存,但其展示的跨楼宇导航与密集避障能力,已为家庭服务、物流配送乃至未来城市交通的无人化描绘出更清晰的落地蓝图。这不仅是技术工具的开源,更是一种高效研发范式的示范。

腾讯文档行业首发「人机双写」原生接入WorkBuddy构建AI原生编辑器
阿里通义开源 Qwen3-ASR 语音识别模型:支持52语种方言,1.7B版达SOTA,0.6B版吞吐提升2000倍
MiniMax Speech 2.6语音模型发布:超低延时+40+语种,Fluent LoRA技术引领AIGC新范式
砸下 10 亿英镑!英国打响AI芯片“保卫战”,全力拦截本土企业流向美国
文心一格
TAGGED:上海人工智能实验室导航机器人端到端
分享
Email 复制链接 打印
Share
上一篇 VoxCPM:面壁智能联合清华推出0.5B参数语音模型,实现业界顶尖零样本克隆与实时合成
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

VoxCPM:面壁智能联合清华推出0.5B参数语音模型,实现业界顶尖零样本克隆与实时合成
AI 工具 AIGC 资讯
上海AI实验室开源InternVLA-A1:600万条语料+一脑多形,具身智能大模型实现跨场景零样本泛化
AI 工具 AIGC 资讯
蚂蚁百灵Ling-V2:160亿参数MoE模型开源,14亿激活参数实现7倍效率飞跃
AI 工具 AIGC 资讯
腾讯开源FastMTP:大模型推理加速2倍且质量无损,实战代码/数学场景速览
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Step Image Edit 2:3.5B参数轻量模型如何秒杀20B级开源大模型?阶跃星辰发布新一代图像编辑模型

站外新闻
AIGC 图像生成模型 图像编辑 轻量级大模型 阶跃星辰
AIGC 资讯

万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型

站外新闻
AIGC 资讯

Hermes Desktop – Nous Research 推出的 Hermes 桌面端

站外新闻
AI 工具AIGC 资讯

清华微软联手开源Kronos:全球首个金融K线图基础模型,预测精度碾压传统方法

站外新闻
Kronos K线图基础模型 微软亚洲研究院 时间序列预测 清华大学
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.