Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Pippo – Meta 推出的单图生成多视角高清人像视频模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Pippo – Meta 推出的单图生成多视角高清人像视频模型
AIGC 资讯

Pippo – Meta 推出的单图生成多视角高清人像视频模型

站外新闻
最近更新: 2026年6月8日 下午3:23
SHARE

Pippo是什么

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练了30亿张人像图像,在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块,用于注入像素对齐的条件,以及注意力偏差技术,能在推理时生成比训练时多5倍以上的视角。Pippo引入了重投影误差,用于评估多视角生成的3D一致性。

阅读目录
  • Pippo是什么
  • Pippo的主要功能
  • Pippo的技术原理
  • Pippo的项目地址
  • Pippo的应用场景

Pippo

Pippo的主要功能

  • 多视角生成:Pippo可以从单张全身或面部照片生成多视角的高清视频,支持全身、面部或头部的生成。
  • 高效内容生成:通过多视角扩散变换器,Pippo能生成多达5倍于训练视角的视频内容。
  • 高分辨率支持:Pippo首次实现了1K分辨率下的一致多视角人像生成。
  • 空间锚点与ControlMLP:通过ControlMLP模块注入像素对齐的条件,如Plücker射线和空间锚点,实现更好的3D一致性。
  • 自动补全细节:在处理单目视频时,Pippo可以自动补全缺失的细节,如鞋子、面部或颈部等。

Pippo的技术原理

  • 多阶段训练策略:
    • 预训练阶段:Pippo首先在30亿张无结构的人像图像上进行预训练,这些图像没有标注信息。
    • 中间训练阶段:在高质量工作室数据集上,模型联合生成多个视角的图像,使用低分辨率的视图进行去噪,通过浅层MLP粗略编码目标相机。
    • 后训练阶段:在高分辨率下对少量视图进行去噪,引入像素对齐控制(如空间锚点和Plücker射线),实现3D一致性。
  • 像素对齐控制(ControlMLP模块):Pippo通过ControlMLP模块注入像素对齐的条件,如Plücker射线和空间锚点,这些条件在训练阶段使用,在推理阶段固定为任意位置。
  • 注意力偏差技术:在推理阶段,Pippo提出了注意力偏差技术,支持模型同时生成比训练阶段多5倍以上的视角。
  • 3D一致性评估指标:Pippo引入了改进的3D一致性评估指标——重投影误差(Re-projection Error),用于评估多视角生成的3D一致性。

Pippo的项目地址

  • 项目官网:https://yashkant.github.io/pippo/
  • Github仓库:https://github.com/facebookresearch/pippo
  • 技术论文:https://yashkant.github.io/pippo/pippo.pdf

Pippo的应用场景

  • 虚拟现实(VR)和增强现实(AR):Pippo能生成高质量的多视角人像视频,可直接用于VR和AR环境中的虚拟角色生成,提升沉浸感。
  • 影视制作:在影视后期制作中,Pippo可用于快速生成多视角的特效镜头,减少拍摄成本和时间。
  • 视频会议:通过从单张照片生成多视角视频,Pippo可以在视频会议中为远程参与者提供更自然的交互体验。
  • 游戏开发:Pippo可用于生成游戏中的角色动画,提升游戏的视觉效果和玩家的沉浸感。
  • 社交媒体和内容创作:创作者可以用Pippo生成多视角视频,为社交媒体平台提供更丰富的内容。
OpenAI重磅出击:ChatGPT广告管理器全面开放,中小企业低门槛入场抢占AI广告新蓝海
OpenAI Codex重磅更新:Mac锁屏也能自动执行任务,开发者生产力迎来颠覆式提升
InternVL – OpenGVLab 推出的多模态大模型
2023 年人工智能与开源界的风云变幻 [译]
Eagle 2.5 – 英伟达推出的视觉语言模型
分享
Email 复制链接 打印
Share
上一篇 DCEdit – 北交大联合美图推出的双层控制图像编辑方法
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DCEdit – 北交大联合美图推出的双层控制图像编辑方法
AIGC 资讯
ChatGPT 升级记忆系统 全面推向用户
AIGC 资讯
NextGenAI – OpenAI 推出的教育联盟,联合15家顶尖大学和机构
AIGC 资讯
Agentic Object Detection – 吴恩达团队推出的Agent目标检测技术
AIGC 资讯

相关推荐

AIGC 资讯

Moonlight-16B-A3B – 月之暗面开源的 MoE 模型

站外新闻
AIGC 资讯

Seedream 3.0 – 字节推出的 AI 图片生成模型,精准生成复杂中文内容

站外新闻
AI 工具AIGC 资讯

Cursor发布Composer 2.5:自研Agentic编程模型,性能比肩Opus 4.7、成本仅1/10

站外新闻
Agentic编程模型 AI编程工具 Composer 2.5 Cursor SWE-Bench
AIGC 资讯

Midjourney 不同画面艺术流派风格 Prompts 对人像生成效果的影响

OZ
AI人像 AI生成 AI绘画 Midjourney prompt 人像
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.