Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架
AIGC 资讯

Motion Anything – 腾讯联合京东等高校推出的多模态运动生成框架

站外新闻
最近更新: 2026年6月8日 上午11:48
SHARE

Motion Anything是什么

Motion Anything 是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或两者的组合生成高质量、可控的人类运动。Motion Anything引入基于注意力的掩码建模方法,实现对运动序列中关键帧和动作的细粒度控制,解决现有方法无法根据条件优先生成动态内容的问题。框架基于时间自适应和空间对齐变换器,有效整合多种模态条件,提升生成运动的连贯性和多样性。同时推出 Text-Music-Dance (TMD) 数据集,包含 2153 对文本、音乐和舞蹈的配对样本,为多模态运动生成的研究提供了新的基准。

阅读目录
  • Motion Anything是什么
  • Motion Anything的主要功能
  • Motion Anything的技术原理
  • Motion Anything的项目地址
  • Motion Anything的应用场景

Motion Anything

Motion Anything的主要功能

  • 多模态条件下的运动生成:根据文本描述、音乐或两者的组合生成高质量的人类运动。
  • 细粒度控制:基于注意力机制,对运动的关键帧和动作进行细粒度控制,实现更精准的生成效果。
  • 动态优先级调整:根据给定条件(如文本或音乐)动态调整运动生成的优先级,优先生成与条件最相关的动态帧和身体部位。
  • 跨模态对齐:将文本、音乐和运动在时间和空间维度上进行有效对齐,提升生成运动的连贯性和一致性。

Motion Anything的技术原理

  • 基于注意力的掩码建模:基于注意力机制选择与条件(文本或音乐)最相关的运动部分进行掩码。在生成过程中,模型优先恢复被掩码的关键帧和动作,实现对动态内容的聚焦。
  • 时间自适应变换器:根据条件的模态(文本、音乐或两者的组合),动态调整注意力计算。让运动的关键帧与文本中的关键词或音乐的节拍对齐,提升时间维度上的连贯性。
  • 空间对齐变换器:将条件和运动嵌入重新排列,暴露空间维度。恢复被掩码的关键动作,确保运动与条件在空间上的一致性。
  • 多模态条件编码:同时处理文本和音乐等多种模态条件,基于自适应编码器将不同模态的信息整合到运动生成中。实现多模态条件下的可控运动生成,提升生成效果。
  • 数据集支持:提供新的 Text-Music-Dance (TMD) 数据集,包含 2153 对文本、音乐和舞蹈的配对样本,为多模态运动生成提供丰富的数据支持。

Motion Anything的项目地址

  • 项目官网:https://steve-zeyu-zhang.github.io/MotionAnything/
  • GitHub仓库:https://github.com/steve-zeyu-zhang/MotionAnything
  • arXiv技术论文:https://arxiv.org/pdf/2503.06955

Motion Anything的应用场景

  • 影视动画:快速生成高质量动画,减少制作成本,提升视觉效果。
  • VR/AR:为虚拟角色生成逼真动作,增强沉浸感,实现自然交互。
  • 游戏开发:根据剧情或音乐生成角色动作,提升游戏的趣味性和流畅性。
  • 人机交互:生成自然动作,让机器人与人类交互更友好,实现语音指令驱动的动作生成。
  • 教育与培训:生成标准动作示范,辅助体育、舞蹈等教学,提升培训效果。
阿里Qwen3.6-Plus发布:百万上下文+超低参数量,编码智能体性能直逼Claude 4.5 Opus
Phi-4-reasoning – 微软推出的Phi-4推理模型系列
Spotify Studio 桌面应用重磅发布!AI 电台+生成式音频平台深度解析
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
腾讯混元 Hy-MT2 开源翻译大模型:7B 参数性能碾压 Gemini,440MB 量化版让手机变身离线翻译机
分享
Email 复制链接 打印
Share
上一篇 OLMo 2 32B – Ai2 推出的最新开源语言模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

OLMo 2 32B – Ai2 推出的最新开源语言模型
AIGC 资讯
UniToken – 复旦联合美团等机构推出的统一视觉编码框架
AIGC 资讯
豆包·语音播客模型 – 火山引擎推出的语音播客模型
AIGC 资讯
OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

MemPrivacy:记忆张量与荣耀AI联合开源,端云协同隐私保护框架,如何为Agent长期记忆筑牢安全防线?

站外新闻
Agent记忆 端云协同 荣耀AI 记忆张量 隐私保护框架
AIGC 资讯

Dynamic Workflows – Claude Code 推出的动态工作流

站外新闻
AIGC 资讯

TripoSG – VAST AI 开源的高保真 3D 形状合成技术

站外新闻
AIGC 资讯

SpatialLM – 群核科技开源的空间理解多模态模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.