Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Pippo – Meta 推出的单图生成多视角高清人像视频模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Pippo – Meta 推出的单图生成多视角高清人像视频模型
AIGC 资讯

Pippo – Meta 推出的单图生成多视角高清人像视频模型

站外新闻
最近更新: 2026年6月8日 下午3:23
SHARE

Pippo是什么

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练了30亿张人像图像,在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块,用于注入像素对齐的条件,以及注意力偏差技术,能在推理时生成比训练时多5倍以上的视角。Pippo引入了重投影误差,用于评估多视角生成的3D一致性。

阅读目录
  • Pippo是什么
  • Pippo的主要功能
  • Pippo的技术原理
  • Pippo的项目地址
  • Pippo的应用场景

Pippo

Pippo的主要功能

  • 多视角生成:Pippo可以从单张全身或面部照片生成多视角的高清视频,支持全身、面部或头部的生成。
  • 高效内容生成:通过多视角扩散变换器,Pippo能生成多达5倍于训练视角的视频内容。
  • 高分辨率支持:Pippo首次实现了1K分辨率下的一致多视角人像生成。
  • 空间锚点与ControlMLP:通过ControlMLP模块注入像素对齐的条件,如Plücker射线和空间锚点,实现更好的3D一致性。
  • 自动补全细节:在处理单目视频时,Pippo可以自动补全缺失的细节,如鞋子、面部或颈部等。

Pippo的技术原理

  • 多阶段训练策略:
    • 预训练阶段:Pippo首先在30亿张无结构的人像图像上进行预训练,这些图像没有标注信息。
    • 中间训练阶段:在高质量工作室数据集上,模型联合生成多个视角的图像,使用低分辨率的视图进行去噪,通过浅层MLP粗略编码目标相机。
    • 后训练阶段:在高分辨率下对少量视图进行去噪,引入像素对齐控制(如空间锚点和Plücker射线),实现3D一致性。
  • 像素对齐控制(ControlMLP模块):Pippo通过ControlMLP模块注入像素对齐的条件,如Plücker射线和空间锚点,这些条件在训练阶段使用,在推理阶段固定为任意位置。
  • 注意力偏差技术:在推理阶段,Pippo提出了注意力偏差技术,支持模型同时生成比训练阶段多5倍以上的视角。
  • 3D一致性评估指标:Pippo引入了改进的3D一致性评估指标——重投影误差(Re-projection Error),用于评估多视角生成的3D一致性。

Pippo的项目地址

  • 项目官网:https://yashkant.github.io/pippo/
  • Github仓库:https://github.com/facebookresearch/pippo
  • 技术论文:https://yashkant.github.io/pippo/pippo.pdf

Pippo的应用场景

  • 虚拟现实(VR)和增强现实(AR):Pippo能生成高质量的多视角人像视频,可直接用于VR和AR环境中的虚拟角色生成,提升沉浸感。
  • 影视制作:在影视后期制作中,Pippo可用于快速生成多视角的特效镜头,减少拍摄成本和时间。
  • 视频会议:通过从单张照片生成多视角视频,Pippo可以在视频会议中为远程参与者提供更自然的交互体验。
  • 游戏开发:Pippo可用于生成游戏中的角色动画,提升游戏的视觉效果和玩家的沉浸感。
  • 社交媒体和内容创作:创作者可以用Pippo生成多视角视频,为社交媒体平台提供更丰富的内容。
AI芯片短缺危机!SpaceX Terafab晶圆厂成败难料,或重塑太空AI格局
WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型
突破扩散模型极限!蚂蚁集团开源100B参数LLaDA 2.0,推理速度2倍超越自回归模型
WriteHERE – 开源的AI长文写作框架,单次生成超长文本
小米MiMo-V2.5发布:1T参数全模态Agent,千轮调用+1M上下文,开源在即
分享
Email 复制链接 打印
Share
上一篇 DCEdit – 北交大联合美图推出的双层控制图像编辑方法
下一篇 Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

SkyReels-A1 – 昆仑万维开源的表情动作可控算法

站外新闻
AI 工具AIGC 资讯

腾讯「代号Craft」重磅发布:AIGC如何让「人人皆可开发游戏」成为现实?

站外新闻
AIGC AI创作平台 代号Craft 游戏开发 腾讯
AIGC 资讯

R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯

央视曝光!AI伪造专家、’医用级’噱头成重灾区,监管重拳整治直播带货乱象

站外新闻
AI伪造专家 互联网广告监管 医用级 直播带货 虚假宣传
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.