Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架
AIGC 资讯

VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架

站外新闻
最近更新: 2026年6月9日 下午5:37
SHARE

VideoMaker是什么

VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频生成框架。与传统方法不同,VideoMaker无需额外模型即可直接从参考图片中提取和注入主题特征,实现个性化视频内容的一键生成。框架基于VDM的内在能力进行细粒度特征提取,通过空间自注意力机制实现特征注入,保证了视频生成的多样性和主题一致性。VideoMaker在保持视频多样性的同时,确保了与参考图片中的主题特征高度契合,为个性化视频创作带来了极大的便捷性和灵活性。

阅读目录
  • VideoMaker是什么
  • VideoMaker的主要功能
  • VideoMaker的技术原理
  • VideoMaker的项目地址
  • VideoMaker的应用场景

VideoMaker的主要功能

  • 细粒度特征提取:VideoMaker能够直接利用视频扩散模型(VDM)的内在能力,从提供的参考图片中提取细节丰富的主题特征。
  • 特征注入:通过VDM的空间自注意力机制,VideoMaker能在视频生成过程中将提取的主题特征有效地注入到每一帧视频中,确保视频内容与参考图片保持高度一致性。
  • 视频内容生成:在保持与参考图片中主题外观一致的同时,VideoMaker还能保证生成视频的多样性和动态性,避免内容单调和重复。
  • 无需额外训练:VideoMaker不需要对VDM进行复杂的再训练或参数调整,只需简单微调即可激活模型的内在力量,实现定制视频生成。
  • 高保真度:VideoMaker生成的视频能够保持高保真度,无论是人物还是物体,都能在视频中准确呈现其外观和动态特征。

VideoMaker的技术原理

  • 视频扩散模型(VDM):VDM是VideoMaker的核心,通过逐步去噪的方式学习视频数据分布,生成视频。
  • 特征提取:VideoMaker将参考图像直接输入到VDM中,利用VDM的预训练知识进行细粒度的特征提取,这些特征与VDM的知识体系高度契合。
  • 空间自注意力机制:VideoMaker通过修改VDM中的空间自注意力计算,实现特征注入。这种机制允许模型在生成每一帧视频时,将主题特征与生成内容进行双向交互,确保主题特征的准确呈现。
  • 引导信息识别损失:为了在训练过程中区分参考信息和生成内容,VideoMaker设计了一种损失函数,帮助模型更准确地识别和处理参考信息。
  • 训练与推理范式:在训练阶段,VideoMaker通过微调VDM的空间自注意力层和运动块参数,实现主题信息的有效注入。在推理时,直接丢弃与参考信息对应的输出,确保生成的视频不受噪声干扰。

VideoMaker的项目地址

  • 项目官网:https://wutao-cs.github.io/VideoMaker/
  • arXiv技术论文:https://arxiv.org/pdf/2412.19645

VideoMaker的应用场景

  • 影视制作:在电影或电视剧的前期制作中,VideoMaker可以用于生成特定的场景和动作,帮助导演和制片人预览和规划。
  • 虚拟偶像:为虚拟偶像生成多样化的视频内容,增强其与粉丝的互动和影响力。
  • 产品展示:企业可以利用VideoMaker展示产品在不同环境下的效果,如家具在不同装修风格中的效果,汽车在不同路况下的表现。
  • 定制广告:根据目标客户群体定制个性化的广告视频,提高广告的吸引力和营销效果。
  • 教学视频:教师可以制作生动的教学视频,如物理力学原理的演示、化学实验现象的展示,以及历史事件的重现,提升学习体验。
  • 动画游戏设计:游戏设计师可以通过输入角色草图和动作设计概念图,快速生成初步的角色动画视频,评估角色动作的流畅性和视觉效果。
Win11 AI 再进化:任务栏集成 Copilot 助手,图片表格一键转 Excel 重塑办公效率
Cloudflare 作为 AI 领域的新动向:与 CEO Matthew Prince 的专访 [译]
smolagents – Hugging Face 开源的轻量级 Agent 构建库
MiniMax M2.7重磅发布:全球首个自我进化AI大模型,软件工程评测56.22%逼近GPT,开源办公能力登顶
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
分享
Email 复制链接 打印
Share
上一篇 CodeElo – 阿里 Qwen 团队推出评估 LLM 编程能力的基准测试
下一篇 EdgeClaw:面壁智能联合清华开源AI智能体框架,首创三层数据安全协议,实现端云协同与本地隐私守护
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

斯坦福重磅开源OpenJarvis:本地AI智能体框架,隐私、成本、延迟全优化
AI 工具 AIGC 资讯
智谱AI发布GLM-5-Turbo:专为龙虾Agent优化,深度解决大模型工具调用与长任务失速难题
AI 工具 AIGC 资讯
清华重磅开源!OpenMAIC:一键将任意文档转为AI多智能体交互课堂,备课成本仅为传统MOOC千分之一
AI 工具 AIGC 资讯
阿里开源影视级配音模型Fun-CineForge:精准口型同步+情绪克隆,重新定义多模态AI配音
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

VimRAG重磅开源:阿里通义首创多模态记忆图,企业级图文视频RAG精度飙升50%

站外新闻
VimRAG 多模态RAG 大模型Agent 知识库检索 阿里通义
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

OpenAI推理模型自主破解80年数学难题:AI从研究助理迈入科学发现者新纪元

站外新闻
AGI openai 数学难题 科学发现 通用推理模型
AI 工具AIGC 资讯

百度ERNIE-Image 8B文生图模型重磅开源:中英长文本精准渲染+24GB显存本地跑

站外新闻
AIGC Diffusion Transformer 开源模型 文生图模型 百度文心
AIGC 资讯

Insert Anything – 浙大联合哈佛大学和南洋理工推出的图像插入框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.