Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架
AIGC 资讯

FaceShot – 同济大学联合上海 AI Lab等推出的肖像动画生成框架

站外新闻
最近更新: 2026年6月7日 下午8:03
SHARE

FaceShot是什么

FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块,为各种角色生成精确且鲁棒的地标序列,基于潜在扩散模型的语义对应关系,跨越广泛的角色类型生成面部动作序列。将地标序列输入预训练的地标驱动动画模型生成动画视频。FaceShot突破对现实肖像地标的限制,适用于任何风格化的角色和驱动视频,或作为插件与任何地标驱动的动画模型兼容,显著提升整体性能。

阅读目录
  • FaceShot是什么
  • FaceShot的主要功能
  • FaceShot的技术原理
  • FaceShot的项目地址
  • FaceShot的应用场景

FaceShot

FaceShot的主要功能

  • 角色动画生成:为各种类型的角色生成流畅且自然的面部动画,保持角色的原始特征。
  • 跨领域动画:支持从人类视频驱动非人类角色(如玩具、动物等)的动画,扩展肖像动画的应用范围。
  • 无需训练:无需针对每个角色或驱动视频进行额外的训练或微调,直接生成高质量的动画。
  • 兼容性:作为插件与任何地标驱动的动画模型无缝集成。

FaceShot的技术原理

  • 外观引导的地标匹配模块:基于潜在扩散模型的语义对应关系,结合外观先验知识,为任意角色生成精确的面部地标。用DDIM逆过程从参考图像和目标图像中提取扩散特征,基于图像提示减少不同领域之间的外观差异。用余弦距离进行地标匹配,确保地标在语义上的一致性,引入外观画廊进一步优化匹配效果。
  • 基于坐标的地标重定位模块:基于坐标系变换捕捉驱动视频中的细微面部动作,生成与之对齐的地标序列。模块分为全局运动和局部运动两个阶段,全局运动负责计算面部的整体平移和旋转,局部运动则分别对眼睛、嘴巴、鼻子、眉毛和面部边界等部分进行相对运动和点运动的重定位。基于简单的坐标变换公式,模块能精确捕捉面部的全局和局部运动,生成稳定的地标序列。
  • 地标驱动的动画模型:模块将生成的地标序列输入预训练的动画模型(如MOFA-Video),生成最终的动画视频。将地标序列作为额外条件输入到动画模型的U-Net中,确保模型能精确跟踪地标序列中的运动。基于这种方式,动画模型能用地标序列生成与驱动视频一致的动画效果,保持角色的视觉身份,实现高质量的肖像动画生成。

FaceShot的项目地址

  • 项目官网:https://faceshot2024.github.io/faceshot/
  • GitHub仓库:https://github.com/open-mmlab/FaceShot
  • arXiv技术论文:https://arxiv.org/pdf/2503.00740

FaceShot的应用场景

  • 影视娱乐:为电影、电视剧中的角色生成生动动画,提升视觉效果。
  • 游戏开发:快速生成游戏角色动画,增强表现力和趣味性。
  • 教育领域:使教育内容更生动,提高学生学习兴趣和教学互动性。
  • 广告营销:生成品牌吉祥物动画,提升品牌形象和用户参与感。
  • VR/AR应用:生成虚拟角色动画,提升沉浸感和交互体验。
Qwen3-Max:阿里通义超万亿参数模型发布,性能超越GPT-5,AI Agent与推理能力全面解析
Social Media Agent – AI社交媒体内容管理工具,输入URL自动生成帖子
昆仑万维开源Matrix-3D:从单张图片或文字生成可探索全景3D世界的革命性框架
AnimaTensor:基于V-Prediction技术的二次元图像生成模型|吐司AI发布Pro/Regular版本
Phi-4-Multimodal – 微软最新推出的多模态语言模型
分享
Email 复制链接 打印
Share
上一篇 SWEET-RL – Meta 推出的多轮强化学习框架
下一篇 LangGraph WhatsApp Agent – 用于构建与 WhatsApp 用户互动的 AI Agent
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI 工具 AIGC 资讯
阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具 AIGC 资讯
Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

OpenAI官方命令行工具震撼发布:一键调用GPT-5.5,开发者效率革命已至

站外新闻
API调试 GPT-5.5 OpenAI CLI 命令行工具 自动化脚本
AIGC 资讯

URM – 阿里妈妈推出的世界知识大模型

站外新闻
AIGC 资讯

MemU开源记忆框架:让AI情感陪伴更懂你,92%准确率+50ms检索速度

站外新闻
AI记忆框架 MemU 情感陪伴 知识图谱
AIGC 资讯

DynamicCity – 上海 AI Lab 推出的4D动态场景生成框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.