Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: LCVD – 川大推出的光照可控肖像动画生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > LCVD – 川大推出的光照可控肖像动画生成框架
AIGC 资讯

LCVD – 川大推出的光照可控肖像动画生成框架

站外新闻
最近更新: 2026年6月8日 下午10:19
SHARE

LCVD是什么

LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征(如身份和外观)与外在特征(如姿态和光照),参考适配器和阴影适配器将特征分别映射到不同的子空间中。在动画生成过程中,LCVD结合特征子空间,基于多条件分类器自由引导机制精细调控光照效果,保留肖像的身份和外观。模型基于稳定的视频扩散模型(SVD),生成与驱动视频姿态一致且符合目标光照条件的高质量肖像动画。LCVD在光照真实感、图像质量和视频一致性方面显著优于现有方法,为虚拟现实、视频会议和影视制作等领域提供了强大的技术支持。

阅读目录
  • LCVD是什么
  • LCVD的主要功能
  • LCVD的技术原理
  • LCVD的项目地址
  • LCVD的应用场景

LCVD

LCVD的主要功能

  • 肖像动画化:将静态肖像转化为动态视频,匹配驱动视频中的头部动作和表情。
  • 光照控制:在动画生成过程中,根据用户指定或参考图像的光照条件对肖像进行重打光。
  • 身份与外观保留:在动画和重打光过程中,保持肖像的身份和外观特征,避免身份信息丢失。
  • 高质量视频生成:生成的视频在光照真实感、图像质量和视频一致性方面表现优异,适合虚拟现实、视频会议和影视制作等场景。

LCVD的技术原理

  • 特征分离:参考适配器(Reference Adapter)将参考肖像的内在特征(身份和外观)映射到特征空间。阴影适配器(Shading Adapter)将外在特征(光照和姿态)映射到特征空间。基于分离内在和外在特征,模型在动画化过程中独立控制光照和姿态。
  • 光照可控的扩散模型:基于稳定视频扩散模型(Stable Video Diffusion Model),用多条件分类器自由引导(Classifier-Free Guidance)调整光照效果。修改引导强度(如权重 ω),增强或减弱光照提示的影响,实现精细的光照控制。
  • 运动对齐与长视频生成:基于运动对齐模块,确保生成的肖像与驱动视频的姿态一致。用扩散模型采样方法,生成任意长度的视频,基于重叠策略确保视频片段之间的平滑过渡。
  • 训练与优化:在训练阶段,自监督学习优化适配器和扩散模型,确保生成的视频在光照、姿态和身份上的一致性。用损失函数(如 LPIPS、FID 等)评估和优化生成视频的质量。

LCVD的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2502.19894

LCVD的应用场景

  • 虚拟现实(VR)和增强现实(AR):创建逼真的虚拟角色,与虚拟或现实场景自然融合。
  • 视频会议:实时生成高质量肖像动画,降低带宽需求,提升用户体验。
  • 影视制作:快速生成符合不同光照条件的肖像动画,用于特效和虚拟场景。
  • 游戏开发:生成逼真的虚拟角色动画,增强游戏的真实感和沉浸感。
  • 社交媒体和内容创作:支持用户生成个性化动态头像或短视频,丰富内容创作形式。
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
VMix – 字节联合中科大推出增强模型生成美学质量的适配器
BEHAVIOR Robot Suite – 李飞飞团队开源的机器人家庭任务自动化框架
阿里通义重磅开源Qwen3-VL-Embedding:多模态检索新标杆,统一文本图像视频语义空间
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
分享
Email 复制链接 打印
Share
上一篇 LalaEval – 港中文联合货拉拉推出面向特定领域的模型评估框架
下一篇 MagicColor – 香港科技大学推出的多实例线稿图着色框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

字节跳动发布SeedVR2:单步视频修复模型,以极低成本实现1080p高清画质革新
AI 工具 AIGC 资讯
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
AI 工具 AIGC 资讯
美团LLIA框架深度解析:实时音频驱动肖像视频生成,如何实现低延迟高保真交互?
AI 工具 AIGC 资讯
腾讯开源Hunyuan3D-2.1:工业级3D生成模型,支持PBR材质与多模态输入,1秒极速出图
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Happy开源AI编程神器:手机远程监控Claude Code,实时掌控开发任务进度

站外新闻
AI编程助手 Claude Code Codex 开源工具 远程编程
AI 工具AIGC 资讯

谷歌 Gemini 3 重磅发布:1501 Elo 登顶,多模态推理新王如何重塑 AI 开发与应用?

站外新闻
AI 推理 Gemini 3 LMArena 多模态大模型 谷歌
AI 工具AIGC 资讯

腾讯混元图像3.0图生图模型:80B MoE架构实现精准图像编辑与多图融合|AI创意工具全面解析

站外新闻
AIGC 图像生成模型 图生图 混元图像3.0 腾讯AI
AI 工具AIGC 资讯

IBM发布258M参数轻量级视觉语言模型:高效文档转换,支持多语言与复杂版式

站外新闻
IBM 企业级应用 多模态AI 文档转换 视觉语言模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.