Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DragAnything – 快手联合浙大等机构开源的可控视频生成方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DragAnything – 快手联合浙大等机构开源的可控视频生成方法
AIGC 资讯

DragAnything – 快手联合浙大等机构开源的可控视频生成方法

站外新闻
最近更新: 2026年6月8日 下午10:03
SHARE

DragAnything是什么

DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控视频生成方法,基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体,克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。DragAnything 提供用户友好的交互方式,支持前景、背景及相机运动的灵活控制,在 FID、FVD 和用户研究等评估指标上达到新的最佳性能。

阅读目录
  • DragAnything是什么
  • DragAnything的主要功能
  • DragAnything的技术原理
  • DragAnything的项目地址
  • DragAnything的应用场景

DragAnything

DragAnything的主要功能

  • 实体级运动控制:对视频中的任何实体(包括前景和背景)进行精确的运动控制,不仅是像素级别的操作。
  • 多实体独立控制:支持同时对多个物体进行独立的运动控制,每个物体根据用户定义的轨迹进行不同的运动。
  • 用户友好的交互方式:用户基于简单的交互(如选择区域并拖动)实现复杂的运动控制,无需复杂的输入信号(如分割掩码或深度图)。
  • 相机运动控制:除控制视频中的物体,DragAnything 能实现相机的运动控制,如缩放和平移。
  • 高质量视频生成:在保持运动控制精度的同时,生成高质量的视频内容,适用于多种应用场景。

DragAnything的技术原理

  • 实体表示:推出新的实体表示方法,从扩散模型的潜在特征中提取语义信息表征视频中的每个物体。将物体的语义特征与运动轨迹相结合,实现精确的实体级运动控制。
  • 2D 高斯表示:引入 2D 高斯表示,基于高斯分布对物体的中心区域赋予更高的权重,减少边缘像素的影响,实现更自然的运动控制。
  • 扩散模型:基于扩散模型架构(如 Stable Video Diffusion),用强大的生成能力和去噪能力生成高质量的视频内容。扩散模型基于逐步去除噪声重建视频帧,结合用户输入的运动轨迹和实体表示。
  • 轨迹引导的运动控制:用户基于绘制简单的轨迹定义物体的运动路径,DragAnything 将轨迹与实体表示相结合,生成符合用户意图的视频内容,避免直接操作像素点的局限性,实现更自然和精确的运动控制。
  • 损失函数与优化:在训练阶段,用带有掩码的均方误差(MSE)损失函数,专注于优化用户指定区域的运动控制,保持其他区域的生成质量。

DragAnything的项目地址

  • 项目官网:https://weijiawu.github.io/draganything
  • GitHub仓库:https://github.com/showlab/DragAnything
  • arXiv技术论文:https://arxiv.org/pdf/2403.07420

DragAnything的应用场景

  • 视频创作与编辑:快速生成动画、调整物体运动轨迹,提升创作效率。
  • 游戏开发:生成角色动作和增强玩家的交互体验。
  • 教育与培训:辅助科学模拟和技能培训,帮助理解复杂运动过程。
  • 广告与营销:制作动态广告和产品展示,突出产品特点。
  • 娱乐与社交:生成互动视频和控制虚拟角色动作,增强趣味性。
ImageRAG – 基于检索增强生成的图像生成技术
GLM-4-32B – 智谱开源的新一代基座模型
EPLB – DeepSeek 开源的专家并行负载均衡器
Open Code Review – 阿里开源的 AI 代码审查 CLI 工具
LDGen – 理想汽车推出的多语言文本到图像生成技术
分享
Email 复制链接 打印
Share
上一篇 GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
AIGC 资讯
Helix – Figure 推出的端到端通用控制模型
AIGC 资讯
LaWGPT – 南京大学推出的中文法律大语言模型
AIGC 资讯
VideoCaptioner – AI视频字幕处理工具,支持字幕样式调整和多格式导出
AIGC 资讯

相关推荐

AIGC 资讯

Lumina-Video – 上海 AI Lab 和港中文推出的视频生成框架

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯

重磅!IBM红帽豪掷50亿美元成立光井计划,AI驱动万亿开源生态安全革命

站外新闻
AI安全 IBM 可信企业清算所 开源软件安全 红帽
AIGC 资讯

ChatUI – 阿里推出的开源智能对话式 UI 组件库

站外新闻
AIGC 资讯

Polar – 英伟达开源的智能体强化学习训练框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.