Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: HMA – MIT联合Meta等推出的机器人动作视频动态建模方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > HMA – MIT联合Meta等推出的机器人动作视频动态建模方法
AIGC 资讯

HMA – MIT联合Meta等推出的机器人动作视频动态建模方法

站外新闻
最近更新: 2026年6月9日 上午8:29
SHARE

HMA是什么

HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的,用在建模机器人动作视频动态的方法。HMA基于异构预训练,用不同机器人实体、领域和任务中的观测和动作序列,结合掩码自回归技术生成视频预测。HMA支持离散和连续两种变体,分别用在快速生成和高保真度生成,处理动作空间的异构性,包括不同的动作频率、维度和动作空间,基于模块化网络架构实现高效的实时交互。HMA在机器人学习中具有广泛的应用前景,包括视频模拟、策略评估、合成数据生成和作为模仿策略使用,在扩展性和实时性方面表现出色。

阅读目录
  • HMA是什么
  • HMA的主要功能
  • HMA的技术原理
  • HMA的项目地址
  • HMA的应用场景

HMA

HMA的主要功能

  • 视频模拟:生成高质量的视频序列,模拟机器人在不同环境中的动作效果,用在虚拟环境中的交互和测试。
  • 策略评估:作为高保真度的模拟器,评估机器人策略的性能,预测策略在真实环境中的表现。
  • 合成数据生成:生成大量的合成数据,增强机器人的训练数据集,提升策略的泛化能力。
  • 模仿策略:直接作为模仿学习的策略,预测机器人在给定观测下的动作。

HMA的技术原理

  • 异构预训练:
    • 数据来源:用来自不同机器人实体、任务和领域的大量观测和动作序列数据进行预训练,涵盖从简单到复杂的动作空间。
    • 动作异构性处理:基于为每个领域设计特定的动作编码器和解码器,将不同动作空间映射到共享的潜在空间中,处理动作频率、维度和动作空间的异构性。
    • 模块化架构:网络架构包括多个动作输入模块(“stem”)和动作输出模块(“head”),及共享的核心时空变换器(“trunk”),支持高效预训练和灵活扩展。
  • 掩码自回归:
    • 掩码目标:在训练时,模型基于掩码自编码目标随机掩码部分标记,并基于未掩码的标记预测掩码部分,学习序列的联合分布。
    • 自回归生成:在推理时,模型逐步取消掩码,生成未来的视频帧和动作序列。既高效又能保持高生成质量。
    • 两种变体:HMA支持离散变体(生成矢量量化标记)和连续变体(生成软标记),分别用在快速生成和高保真度生成。

HMA的项目地址

  • 项目官网:https://liruiw.github.io/hma/
  • GitHub仓库:https://github.com/liruiw/HMA
  • HuggingFace模型库:https://huggingface.co/liruiw/hma-base-disc
  • arXiv技术论文:https://arxiv.org/pdf/2502.04296
  • 在线体验Demo:https://huggingface.co/spaces/liruiw/hma

HMA的应用场景

  • 实时视频模拟:快速生成机器人在不同环境中的动作视频,用在虚拟交互测试,验证策略效果,节省实际部署成本。
  • 策略评估:作为高保真模拟器,评估机器人策略性能,预测策略在真实环境中的表现,辅助策略优化。
  • 合成数据生成:生成大量合成数据,扩充训练数据集,提升策略泛化能力,尤其在数据稀缺时效果显著。
  • 模仿学习:直接作为模仿策略,根据当前观测预测机器人动作,快速响应环境变化,提高任务执行效率。
  • 长期规划与控制:HMA支持生成长序列的视频和动作预测,助力机器人进行长期规划和模型预测控制,提升复杂任务的完成率。
CodeElo – 阿里 Qwen 团队推出评估 LLM 编程能力的基准测试
微软发布MAI-Image-2-Efficient:轻量高效文生图模型,成本降低41%速度提升,专为企业级商业量产设计
腾讯文档行业首发「人机双写」原生接入WorkBuddy构建AI原生编辑器
Flex.2-preview – Ostris 推出的文本到图像扩散模型
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统
分享
Email 复制链接 打印
Share
上一篇 OmniHuman – 字节跳动推出的单张照片生成全身动态视频生成框架
下一篇 Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

COTA:超参数科技发布全球首款「白盒」游戏AI智能体,LLM驱动实现百毫秒响应与真人级战术决策
AI 工具 AIGC 资讯
深度解析马斯克开源x-Algorithm:X平台推荐算法如何用AI大模型颠覆信息流?
AI 工具
Step3-VL-10B:阶跃星辰开源10B参数多模态模型,性能对标200B级巨模,端侧部署新标杆
AI 工具 AIGC 资讯
EmbodiChain:跨维智能开源平台,100%生成式仿真数据革新具身智能训练
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Miras – 谷歌推出的深度学习架构设计通用框架

站外新闻
AIGC 资讯

AIGC 行业现状

OZ
AIGC AI产业 AI行业 行业
AIGC 资讯

Yuxi-Know – 基于大模型 RAG 知识库的 AI 知识图谱问答平台

站外新闻
AIGC 资讯

Step1X-Edit – 阶跃星辰开源的通用图像编辑框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw OpenRouter prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小米 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯混元 英伟达 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.