Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架
AIGC 资讯

Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架

站外新闻
最近更新: 2026年6月8日 上午11:48
SHARE

Motion Anything是什么

Motion Anything 是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或两者的组合生成高质量、可控的人类运动。Motion Anything引入基于注意力的掩码建模方法,实现对运动序列中关键帧和动作的细粒度控制,解决现有方法无法根据条件优先生成动态内容的问题。框架基于时间自适应和空间对齐变换器,有效整合多种模态条件,提升生成运动的连贯性和多样性。同时推出 Text-Music-Dance (TMD) 数据集,包含 2153 对文本、音乐和舞蹈的配对样本,为多模态运动生成的研究提供了新的基准。

阅读目录
  • Motion Anything是什么
  • Motion Anything的主要功能
  • Motion Anything的技术原理
  • Motion Anything的项目地址
  • Motion Anything的应用场景

Motion Anything

Motion Anything的主要功能

  • 多模态条件下的运动生成:根据文本描述、音乐或两者的组合生成高质量的人类运动。
  • 细粒度控制:基于注意力机制,对运动的关键帧和动作进行细粒度控制,实现更精准的生成效果。
  • 动态优先级调整:根据给定条件(如文本或音乐)动态调整运动生成的优先级,优先生成与条件最相关的动态帧和身体部位。
  • 跨模态对齐:将文本、音乐和运动在时间和空间维度上进行有效对齐,提升生成运动的连贯性和一致性。

Motion Anything的技术原理

  • 基于注意力的掩码建模:基于注意力机制选择与条件(文本或音乐)最相关的运动部分进行掩码。在生成过程中,模型优先恢复被掩码的关键帧和动作,实现对动态内容的聚焦。
  • 时间自适应变换器:根据条件的模态(文本、音乐或两者的组合),动态调整注意力计算。让运动的关键帧与文本中的关键词或音乐的节拍对齐,提升时间维度上的连贯性。
  • 空间对齐变换器:将条件和运动嵌入重新排列,暴露空间维度。恢复被掩码的关键动作,确保运动与条件在空间上的一致性。
  • 多模态条件编码:同时处理文本和音乐等多种模态条件,基于自适应编码器将不同模态的信息整合到运动生成中。实现多模态条件下的可控运动生成,提升生成效果。
  • 数据集支持:提供新的 Text-Music-Dance (TMD) 数据集,包含 2153 对文本、音乐和舞蹈的配对样本,为多模态运动生成提供丰富的数据支持。

Motion Anything的项目地址

  • 项目官网:https://steve-zeyu-zhang.github.io/MotionAnything/
  • GitHub仓库:https://github.com/steve-zeyu-zhang/MotionAnything
  • arXiv技术论文:https://arxiv.org/pdf/2503.06955

Motion Anything的应用场景

  • 影视动画:快速生成高质量动画,减少制作成本,提升视觉效果。
  • VR/AR:为虚拟角色生成逼真动作,增强沉浸感,实现自然交互。
  • 游戏开发:根据剧情或音乐生成角色动作,提升游戏的趣味性和流畅性。
  • 人机交互:生成自然动作,让机器人与人类交互更友好,实现语音指令驱动的动作生成。
  • 教育与培训:生成标准动作示范,辅助体育、舞蹈等教学,提升培训效果。
SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术
可灵2.6重磅升级:快手AI视频生成模型实现音画同步,一键定制专属声线与复杂动作
谷歌强推AI搜索遭用户抵制:DuckDuckGo下载量一周暴涨30%,传统搜索失灵?
TxGemma – 谷歌推出的通用医学治疗大模型
Zerox – 开源的OCR工具,零样本识别多种格式文件
分享
Email 复制链接 打印
Share
上一篇 OLMo 2 32B – Ai2 推出的最新开源语言模型
下一篇 DiffBrush – 北邮联合清华等机构推出的图像生成与编辑框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

PosterCopilot重磅发布:南京大学联手LibLib.ai推出专业海报设计大模型,全链路AI创意设计新范式

站外新闻
AIGC AI创意设计 LibLib.ai PosterCopilot 海报设计大模型
AIGC 资讯

DeerFlow – 字节跳动开源的深度研究框架

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯

Gemini 3.5 生产环境严重失控:越权删光两万行代码并编造修复报告,AI 开发信任危机再升级

站外新闻
AI 安全 AIGC 风险 Gemini 3.5 代码越权 生产事故
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

Mistral AI 首席执行官宣布自研芯片计划:成本、算力、生态三大战略解析

站外新闻
Mistral AI 企业智能体 算力基础设施 自研芯片 英伟达
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.