Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Wan-Move 开源:阿里清华联手,无需改动模型即可实现点级精准运动控制的视频生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > Wan-Move 开源:阿里清华联手,无需改动模型即可实现点级精准运动控制的视频生成框架
AI 工具AIGC 资讯

Wan-Move 开源:阿里清华联手,无需改动模型即可实现点级精准运动控制的视频生成框架

站外新闻
最近更新: 2026年6月7日 下午8:11
AIGC 开源框架 视频生成 运动控制 阿里巴巴
SHARE

💡 站外导读:在AIGC视频生成领域,如何实现精准、细粒度的运动控制一直是核心挑战。传统方法往往需要复杂模型改造或额外模块,门槛高且效果受限。阿里通义实验室与清华大学等机构最新开源的Wan-Move框架,直击这一痛点。它无需对现有图像到视频模型进行任何架构更改,即可通过潜在轨迹引导技术,实现对场景中每个元素的精确点级运动控制,并生成与商业系统质量相当的视频,为行业提供了全新的高效、易用的解决方案。

Wan-Move是什么

Wan-Move 是阿里巴巴通义实验室等机构开源的运动可控视频生成框架,通过潜在轨迹引导实现高质量的视频运动控制。核心亮点在于无需对现有图像到视频模型进行架构更改,可实现细粒度的点级运动控制,能生成 5 秒、480p 的视频,运动控制质量与商业系统相当。Wan-Move 提供了 MoveBench 基准测试,包含大规模样本和高质量轨迹注释,可用于评估和对比不同方法的运动控制能力。

阅读目录
  • Wan-Move是什么
  • Wan-Move的主要功能
  • Wan-Move的技术原理
  • Wan-Move的项目地址
  • Wan-Move的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Wan-Move

Wan-Move的主要功能

  • 高质量运动控制:能生成5秒、480p的视频,其运动控制质量与商业系统相当,满足高质量视频创作需求。
  • 潜在轨迹引导:通过传播第一帧的特征沿轨迹生成时空特征图,无需额外运动模块,可无缝集成到现有图像到视频模型中。
  • 细粒度点级控制:支持对场景中每个元素进行精确的区域级运动控制,实现高度定制化的视频效果。
  • 基准测试MoveBench:提供大规模、多样化、长时长的视频样本和高质量轨迹注释,用于评估和对比不同方法的运动控制能力。
  • 开源与易用性:代码、模型权重和MoveBench均已开源,用户可快速上手进行视频生成和运动控制实验,降低使用门槛。

Wan-Move的技术原理

  • 潜在轨迹引导:Wan-Move 使用潜在轨迹引导技术,将物体的运动表示为密集的点轨迹,并将这些轨迹映射到潜在空间中。通过沿着轨迹传播第一帧的特征,生成对齐的时空特征图,从而实现对视频生成中运动的精细控制。
  • 无需额外模块:框架无需对现有的图像到视频模型(如 Wan-I2V-14B)进行架构更改,也无需添加额外的运动编码器,即可实现运动控制,具有很好的兼容性和扩展性。
  • 大规模训练:通过大规模的训练数据和优化,Wan-Move 能生成高质量的 5 秒、480p 视频,其运动控制能力与商业系统相当,确保了视频的视觉效果和运动的准确性。
  • 细粒度点级控制:物体的运动通过密集点轨迹表示,使用户可以对场景中的每个元素进行精确的区域级运动控制,实现高度定制化的视频效果。
  • 基准测试 MoveBench:为了验证和评估运动控制效果,Wan-Move 提供了 MoveBench 基准测试,包含大规模样本、多样化内容类别、长时长视频和高质量轨迹注释,为研究和开发提供了标准化的测试平台。

Wan-Move的项目地址

  • 项目官网:https://wan-move.github.io/
  • Github仓库:https://github.com/ali-vilab/Wan-Move
  • HuggingFace模型库:https://huggingface.co/Ruihang/Wan-Move-14B-480P
  • arXiv技术论文:https://arxiv.org/pdf/2512.08765

Wan-Move的应用场景

  • 视频创作:用户可以通过定义物体的运动轨迹来生成具有特定运动效果的视频,适用于动画制作、特效设计、创意短视频等领域,帮助创作者快速实现复杂的运动场景。
  • 广告与营销:在广告视频中,Wan-Move 可以用于生成动态的产品展示、品牌故事等,通过精细的运动控制吸引观众注意力,提升广告的吸引力和影响力。
  • 视频编辑:支持对视频的第一帧进行编辑,将这些更改应用到整个视频中,还可以进行运动复制和相机运动控制,帮助视频编辑人员快速调整和优化视频内容。
  • 教育与培训:在教育领域,Wan-Move 可以生成具有动态演示效果的教学视频,例如物理实验、生物动画等,通过生动的运动展示帮助学生更好地理解和学习知识。
  • 游戏开发:在游戏开发中,Wan-Move 可以用于生成游戏中的动画效果,如角色动作、场景变化等,提升游戏的视觉效果和用户体验。
  • 虚拟现实(VR)和增强现实(AR):Wan-Move 可以生成与虚拟环境或增强现实场景相匹配的动态视频内容,为用户提供更加沉浸式的体验。

📝 站长洞察 (Editor’s Insight)

Wan-Move的发布,标志着可控视频生成技术正从“能动”向“精准动”迈进关键一步。其核心价值在于“无侵入式”的架构设计:无需改动现有模型,即可实现细粒度运动控制,这极大降低了技术集成与迭代的门槛,预示着模块化、可插拔将成为AIGC工具链的主流趋势。同时,伴随发布的MoveBench基准测试,为行业建立了统一的评估标尺,这比单个模型本身更具长远意义,它将加速该领域的研究收敛与创新。从商业角度看,这种精准控制能力将直接赋能广告、影视、教育等需要高度定制化动态内容的场景,是AIGC从炫技走向实用、从生成走向创作的关键基础设施。

Mubert
CodeElo – 阿里 Qwen 团队推出评估 LLM 编程能力的基准测试
HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器
英伟达Nemotron 3 Super开源发布:1200亿参数Mamba-MoE架构,智能体推理速度提升3倍,性能直逼Claude Opus 4.6
AutoRAG – 中科院开源的自主迭代检索模型
TAGGED:AIGC开源框架视频生成运动控制阿里巴巴
分享
Email 复制链接 打印
Share
上一篇 快手可灵×港科大重磅开源:UnityVideo统一框架破解多模态视频生成难题,零样本泛化能力领跑行业
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

快手可灵×港科大重磅开源:UnityVideo统一框架破解多模态视频生成难题,零样本泛化能力领跑行业
AI 工具 AIGC 资讯 最新趋势
商汤LightX2V开源:实时视频生成推理框架,4步出视频、8GB显存跑14B模型
AI 工具 AIGC 资讯
英伟达Nemotron 3开源模型系列发布:MoE架构助力4倍吞吐量,重塑多智能体AI开发范式
AI 工具 AIGC 资讯
Banana Slides: 开源AI PPT生成神器,自然语言一键编辑,彻底解放你的演示制作!
AI 工具

相关推荐

AIGC 资讯

留学申请不再“盲人摸象”!AI 留学平台 UniPilot 正式上线,开启透明化教育新时代

站外新闻
AI 工具AIGC 资讯

北大开源One-Eval:告别繁琐配置,自然语言驱动大模型评测,NL2Eval实现全链路自动化

站外新闻
Agent驱动 NL2Eval 北大OpenDCAI 大模型评测 自动化评测框架
AI 工具AIGC 资讯

小米开源首代机器人VLA大模型Xiaomi-Robotics-0:47亿参数MoT架构,实现实时流畅控制

站外新闻
VLA大模型 Xiaomi-Robotics-0 具身智能 小米开源 机器人大模型
AI 工具

Content Company

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 早报 智谱AI 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 端侧部署 网络安全 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.