Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: HunyuanPortrait:腾讯清华联手打造下一代肖像动画引擎,单图驱动视频生成新突破
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > HunyuanPortrait:腾讯清华联手打造下一代肖像动画引擎,单图驱动视频生成新突破
AI 工具AIGC 资讯

HunyuanPortrait:腾讯清华联手打造下一代肖像动画引擎,单图驱动视频生成新突破

站外新闻
最近更新: 2026年6月7日 下午8:28
AIGC 扩散模型 肖像动画 腾讯混元 虚拟数字人
SHARE

💡 站外导读:当前数字内容创作领域,如何让静态图像“活”起来并保持高度真实与可控,一直是核心挑战。传统方法在身份一致性、表情自然度及跨风格泛化上存在明显瓶颈。腾讯混元联合清华大学等顶尖学府推出的HunyuanPortrait框架,直击这一痛点。它利用先进的扩散模型,仅需一张肖像和一个驱动视频,就能生成动画,标志着AIGC在可控视频生成领域迈出了关键一步,为虚拟形象、数字人应用打开了全新可能。

HunyuanPortrait是什么

HunyuanPortrait 是腾讯 Hunyuan 团队联合清华大学、中山大学和香港科技大学等机构共同推出的基于扩散模型的框架,用在生成高度可控且逼真的肖像动画。基于给定一张肖像图片作为外观参考和视频片段作为驱动模板,根据驱动视频中的面部表情和头部姿势动画化参考图片中的人物。HunyuanPortrait 在时间一致性和可控性方面优于现有方法,展现出强大的泛化性能,能有效解耦不同图像风格下的外观和运动,广泛用在虚拟现实、游戏和人机交互等领域。

阅读目录
  • HunyuanPortrait是什么
  • HunyuanPortrait的主要功能
  • HunyuanPortrait的技术原理
  • HunyuanPortrait的项目地址
  • HunyuanPortrait的应用场景
      • 📝 站长洞察 (Editor’s Insight)

HunyuanPortrait

HunyuanPortrait的主要功能

  • 高度可控的肖像动画生成:基于单张肖像图片作为外观参考和视频片段作为驱动模板,精确地将驱动视频中的面部表情和头部姿势转移到参考肖像中,生成自然流畅的动画。
  • 强大的身份一致性保持:在面部结构和运动强度存在显著差异的情况下,保持参考肖像的身份特征,避免身份失真。
  • 逼真的面部动态捕捉:捕捉微妙的面部表情变化,如眼神方向、嘴唇同步等,生成高度逼真的肖像动画。
  • 时间一致性优化:生成的视频在时间上具有高度的连贯性和平滑性,避免背景抖动和模糊等问题。
  • 风格泛化能力:适应不同的图像风格,包括动漫风格和真实照片风格,具有广泛的适用性。

HunyuanPortrait的技术原理

  • 隐式条件控制:用隐式表示编码运动信息,更好地捕捉复杂的面部运动和表情变化,避免因关键点提取不准确导致伪影和失真。将编码后的运动信息作为控制信号,基于注意力机制注入到去噪 U-Net 中,实现对动画生成过程的精细控制。
  • 稳定的视频扩散模型:基于扩散模型的框架,在潜在空间中进行扩散和去噪过程,提高生成质量和训练效率。用 VAE 将图像从 RGB 空间映射到潜在空间,基于 UNet 进行去噪处理,生成高质量的视频帧。
  • 增强的特征提取器:基于估计运动强度(如面部表情的扭曲程度和头部运动的幅度)增强运动特征的表示,提高对不同运动强度的适应能力。结合 ArcFace 和 DiNOv2 背景,用多尺度适配器(IMAdapter)增强肖像的身份一致性,确保生成的动画在不同帧中保持一致的身份特征。
  • 训练和推理策略:基于颜色抖动、姿态引导等技术增强训练数据的多样性,提高模型的泛化能力。用多种增强训练策略,如随机移除某些骨骼边缘,提高模型在不同输入条件下的稳定性。
  • 注意力机制:在 UNet 中引入多头自注意力和交叉注意力机制,增强模型对空间和时间信息的感知能力,提高生成视频的细节丰富度和时间一致性。

HunyuanPortrait的项目地址

  • 项目官网:https://kkakkkka.github.io/HunyuanPortrait/
  • GitHub仓库:https://github.com/Tencent-Hunyuan/HunyuanPortrait
  • HuggingFace模型库:https://huggingface.co/tencent/HunyuanPortrait
  • arXiv技术论文:https://arxiv.org/pdf/2503.18860

HunyuanPortrait的应用场景

  • 虚拟现实(VR)和增强现实(AR):创建逼真的虚拟角色,增强用户体验。
  • 游戏开发:生成个性化的游戏角色,提升玩家的沉浸感。
  • 人机交互:开发更自然的虚拟助手和客服机器人,增强交互效果。
  • 数字内容创作:用在视频制作、广告和影视特效,快速生成高质量的动画内容。
  • 社交媒体和娱乐:用户将自己的照片制作成动态表情包或虚拟形象,增加互动性。
  • 教育和培训:创建个性化的虚拟教师或培训角色,提供更生动的教学体验。

📝 站长洞察 (Editor’s Insight)

HunyuanPortrait的发布,绝非单一产品迭代,而是AIGC从“文生图”迈向“图生可控高保真视频”的里程碑事件。其核心价值在于解决了身份解耦与运动迁移的行业难题,这正是通往通用数字人、元宇宙应用的关键技术拼图。腾讯此次与学术界深度联动,展现了“产业需求定义科研方向”的良性循环。该框架对扩散模型中注意力机制的精细调用,代表了当前视频生成技术的最前沿探索。未来,结合更长的时序建模与多模态输入,此类技术将深度重塑影视、游戏、虚拟社交乃至在线教育的交互形态,是企业级AIGC基础设施的核心能力之一。

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
阿里语音大模型横扫Artificial Analysis三冠:Fun-Realtime-TTS全球第五,ASR、Chat、TTS国产登顶,实时合成技术引领深度智能时代
xAI重磅发布Grok Voice Think Fast 1.0:语音AI智能体技术领先,转化率提升20%
10-13 AIGC早报
KittenTTS:仅25MB的开源TTS模型,CPU实时推理,离线语音时代来临
TAGGED:AIGC扩散模型肖像动画腾讯混元虚拟数字人
分享
Email 复制链接 打印
Share
上一篇 蚂蚁集团开源Ming-Lite-Omni:统一多模态大模型,支持文本、图像、音视频全模态交互与生成
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

蚂蚁集团开源Ming-Lite-Omni:统一多模态大模型,支持文本、图像、音视频全模态交互与生成
AI 工具 AIGC 资讯
AI-Media2Doc:开源AI神器,一键将音视频秒变小红书笔记、公众号爆款文章与思维导图
AI 工具
DeepSeek-R1-0528开源发布:660B参数模型,编程能力超越Claude 4与Gemini 2.5 Pro
AI 工具 AIGC 资讯
2026年6月29日
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

明岐 – 上海交大推出的医学多模态大模型,精准诊断罕见病

站外新闻
AI 工具

Frappe Builder:开源AI低代码建站神器,可视化编辑+一键部署,效率提升10倍

站外新闻
AI工具 Frappe Builder 低代码 可视化编辑 网站构建工具
AIGC 资讯

PanoDreamer – 单张图像生成连贯360° 3D场景的新方法

站外新闻
AI 工具

Ubie AI 医疗

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.