Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VPP – 清华和星动纪元推出的首个AIGC机器人大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VPP – 清华和星动纪元推出的首个AIGC机器人大模型
AIGC 资讯

VPP – 清华和星动纪元推出的首个AIGC机器人大模型

站外新闻
最近更新: 2026年6月8日 下午1:59
SHARE

VPP是什么

VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景生成机器人动作。VPP能提前预知未来,实现高频预测和动作执行,支持跨人形机器人本体切换,显著降低对高质量机器人真机数据的依赖。VPP在Calvin ABC-D基准测试中取得接近满分的成绩,在真实世界的复杂灵巧操作任务中表现出色。VPP的开源为具身智能机器人的发展提供强大的技术支持。

阅读目录
  • VPP是什么
  • VPP的主要功能
  • VPP的技术原理
  • VPP的项目地址
  • VPP的应用场景

VPP

VPP的主要功能

  • 提前预测未来场景:让机器人在行动前“看到”未来,增强泛化能力。
  • 高频预测与动作执行:实现6-10Hz的预测频率和超过50Hz的控制频率,提升动作流畅性。
  • 跨机器人本体学习:直接学习不同形态机器人的视频数据,包括人类操作数据,降低数据获取成本。
  • 多任务学习与泛化:在复杂的真实世界任务中表现出色,例如抓取、放置、堆叠、倒水和工具使用。
  • 可解释性与调试优化:基于预测视频提前发现失败场景,便于开发者进行针对性优化。

VPP的技术原理

  • 视频扩散模型(VDM)的预测性视觉表示:基于预训练的视频扩散模型(如Stable Video Diffusion)学习预测未来场景。视频扩散模型基于单步去噪生成预测性视觉表示,视觉表示包含当前帧,能明确表示未来帧。
  • 动作学习:用Video Former聚合预测性视觉表示,提取时空信息。基于扩散策略(Diffusion Policy)生成机器人动作,实现从预测到执行的无缝过渡。
  • 优化与泛化:VPP基于互联网视频数据和机器人操作数据进行训练,减少对高质量真机数据的依赖。基于跨本体学习,VPP能直接学习不同形态机器人的视频数据,提升模型的泛化能力。

VPP的项目地址

  • 项目官网:https://video-prediction-policy.github.io/
  • GitHub仓库:https://github.com/roboterax/video-prediction-policy
  • arXiv技术论文:https://arxiv.org/pdf/2412.14803

VPP的应用场景

  • 家庭服务:完成家务(倒水、拿东西)、照顾老人或儿童(递送物品)。
  • 工业制造:用在零件抓取、货物搬运和堆叠,提高生产效率。
  • 医疗辅助:协助手术器械传递、康复训练和病房物品递送。
  • 教育与研究:帮助学生理解复杂操作流程,用在实验室实验操作。
  • 服务行业:如餐厅送餐、酒店行李搬运和公共场合导览。
AIGC 绘图基础
微软Build大会重磅出击:自研代码AI平价替代Claude,多场景模型矩阵挑战OpenAI
谷歌AI搜索频现拼写错误引用户流失,DuckDuckGo下载量飙升:AI准确性危机何解?
RepText – Liblib AI联合Shakker Labs推出的多语言视觉文本渲染框架
谷歌Lyria 3 Pro发布:3分钟结构化AI作曲+多平台集成,Suno/ Udio遇劲敌
分享
Email 复制链接 打印
Share
上一篇 Oliva – 开源语音RAG助手,实时语音搜索向量数据库
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Oliva – 开源语音RAG助手,实时语音搜索向量数据库
AIGC 资讯
AuraFusion360 – 三维场景修复技术,实现高质量物体去除和孔洞填充
AIGC 资讯
Gemini 2.5 Flash – 谷歌推出的最新 AI 推理模型
AIGC 资讯
OmniAlign-V – 上海交大联合上海 AI Lab 等推出的高质量数据集
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Claude Opus 4.8正式发布:性能全面超越GPT-5.5,成本暴降66%重塑AI编程格局

站外新闻
AI编程 Anthropic Claude Opus 4.8 GPT-5.5
AIGC 资讯

MeshPad – 草图驱动的AI 3D网格生成与编辑工具

站外新闻
AIGC 资讯

FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架

站外新闻
AIGC 资讯

Midjourney 不同画面艺术流派风格 Prompts 对人像生成效果的影响

OZ
AI人像 AI生成 AI绘画 Midjourney prompt 人像
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.