Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DICE-Talk – 复旦联合腾讯优图推出的情感化动态肖像生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DICE-Talk – 复旦联合腾讯优图推出的情感化动态肖像生成框架
AIGC 资讯

DICE-Talk – 复旦联合腾讯优图推出的情感化动态肖像生成框架

站外新闻
最近更新: 2026年6月7日 下午8:02
SHARE

DICE-Talk是什么

DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE-Talk引入情感关联增强模块,基于情感库捕获不同情感之间的关系,提升情感生成的准确性和多样性。框架设计情感判别目标,基于情感分类确保生成过程中的情感一致性。在MEAD和HDTF数据集上的实验表明,DICE-Talk在情感准确性、对口型和视觉质量方面均优于现有技术。

阅读目录
  • DICE-Talk是什么
  • DICE-Talk的主要功能
  • DICE-Talk的技术原理
  • DICE-Talk的项目地址
  • DICE-Talk的应用场景

DICE-Talk

DICE-Talk的主要功能

  • 情感化动态肖像生成:根据输入的音频和参考图像,生成具有特定情感表达的动态肖像视频。
  • 身份保持:在生成情感化视频时,保持输入参考图像的身份特征,避免身份信息的泄露或混淆。
  • 高质量视频生成:生成的视频在视觉质量、唇部同步和情感表达方面均达到较高水平。
  • 泛化能力:能适应未见过的身份和情感组合,具有良好的泛化能力。
  • 用户控制:用户输入特定的情感目标,控制生成视频的情感表达,实现高度的用户自定义。
  • 多模态输入:支持多种输入模态,包括音频、视频和参考图像。

DICE-Talk的技术原理

  • 解耦身份与情感:基于跨模态注意力机制联合建模音频和视觉情感线索,将情感表示为身份无关的高斯分布。用对比学习(如InfoNCE损失)训练情感嵌入器,确保相同情感的特征在嵌入空间中聚集,不同情感的特征则分散。
  • 情感关联增强:情感库是可学习的模块,存储多种情感的特征表示。用向量量化和基于注意力的特征聚合,学习情感之间的关系。情感库存储单一情感的特征,学习情感之间的关联,帮助模型更好地生成其他情感。
  • 情感判别目标:在扩散模型的生成过程中,基于情感判别器确保生成视频的情感一致性。情感判别器与扩散模型联合训练,确保生成的视频在情感表达上与目标情感一致,保持视觉质量和唇部同步。
  • 扩散模型框架:从高斯噪声开始,逐步去噪生成目标视频。基于变分自编码器(VAE)将视频帧映射到潜在空间,在潜在空间中逐步引入高斯噪声,基于扩散模型逐步去除噪声,生成目标视频。在去噪过程中,扩散模型基于跨模态注意力机制,结合参考图像、音频特征和情感特征,引导视频生成。

DICE-Talk的项目地址

  • 项目官网:https://toto222.github.io/DICE-Talk/
  • GitHub仓库:https://github.com/toto222/DICE-Talk
  • arXiv技术论文:https://arxiv.org/pdf/2504.18087

DICE-Talk的应用场景

  • 数字人与虚拟助手:为数字人和虚拟助手赋予丰富的情感表达,与用户交互时更加自然和生动,提升用户体验。
  • 影视制作:在影视特效和动画制作中,快速生成具有特定情感的动态肖像,提高制作效率,降低制作成本。
  • 虚拟现实与增强现实:在VR/AR应用中,生成与用户情感互动的虚拟角色,增强沉浸感和情感共鸣。
  • 在线教育与培训:创建具有情感反馈的教学视频,让学习内容更加生动有趣,提高学习效果。
  • 心理健康支持:开发情感化虚拟角色,用在心理治疗和情感支持,帮助用户更好地表达和理解情感。
ClawLess:南方科技大学 & 港科大AI Agent安全框架,形式化验证+系统调用拦截,构筑数学级安全壁垒
DreamGen – 英伟达推出的新型机器人学习技术
Sub2API 开源 AI API 中转网关:多账户管理+精准计费,高效实现 AI 订阅拼车共享
InternSVG:上海AI Lab统一SVG建模套件发布,覆盖理解、编辑与生成,性能全面超越GPT-4o
YC总裁亲测开源GBrain:打造AI Agent永生记忆,万级文件知识图谱实战解析
分享
Email 复制链接 打印
Share
上一篇 Llama 4 – Meta 开源的多模态系列AI模型,重夺开源王座
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Llama 4 – Meta 开源的多模态系列AI模型,重夺开源王座
AIGC 资讯
Suna – Kortix推出的全球首款通用型 AI Agent 开源项目
AIGC 资讯
Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型
AIGC 资讯
RoboBrain – 智源研究院开源的具身大脑模型
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

Claude Opus 4.8正式发布:性能全面超越GPT-5.5,成本暴降66%重塑AI编程格局

站外新闻
AI编程 Anthropic Claude Opus 4.8 GPT-5.5
AI 工具AIGC 资讯

腾讯清华联手开源 Pixal3D:单图秒变重建级3D资产,PBR材质一步到位

站外新闻
PBR材质 Pixal3D SIGGRAPH 2026 单图3D生成 腾讯ARC
AIGC 资讯

Seed-Coder – 字节跳动开源的代码模型系列

站外新闻
AI 工具AIGC 资讯

小红书×剑桥大学重磅发布HyperEyes:并行多模态搜索智能体,效率飙升5.3倍,准确率提升9.9%

站外新闻
多模态搜索 大模型 小红书 智能体 视觉定位
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.