Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术
AIGC 资讯

Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术

站外新闻
最近更新: 2026年6月8日 下午11:37
SHARE

Wonderland是什么

Wonderland是多伦多大学、Snap和UCLA的研究团队推出的技术,能够从单张图像生成高质量、广范围的3D场景,允许控制摄像轨迹。证明了三维重建模型可以有效地建立在扩散模型的潜在空间上,实现高效的三维场景生成,是单视图3D场景生成领域的一次突破性进展。通过结合视频扩散模型和大规模3D重建模型,Wonderland解决了传统3D重建技术中的视角失真问题,实现了精确的视角控制和多视角视频生成。

阅读目录
  • Wonderland是什么
  • Wonderland的主要功能
  • Wonderland的技术原理
  • Wonderland的项目地址
  • Wonderland的应用场景

Wonderland的主要功能

  • 视频生成:基于单张图和camera condition,Wonderland能实现视频生成的精准视角控制,生成3D-geometry一致的高质量视频,具有很强的泛化性,可以遵循各种复杂的轨迹,适用于各种风格的输入图片。
  • 3D场景生成:基于单张图,基于LaLRM,Wonderland可以生成高质量的、广阔的3D场景,能够深度探索和生成高质量的、广阔的3D场景。
  • Zero-shot 3D 场景生成:在单图像输入的前提下,Wonderland可进行高效的3D场景前向重建,在多个基准数据集上的3D场景重建质量均优于现有方法。
  • 广覆盖场景生成能力:Wonderland能高效生成广范围的复杂场景,生成的3D场景具备高度的几何一致性,还具有很强的泛化性,能处理out-of-domain的场景。

Wonderland的技术原理

  • 视频扩散模型与3D重建模型的结合:Wonderland首次证明了三维重建模型可以有效地建立在扩散模型的潜在空间上,实现高效的三维场景生成。视频扩散模型可以精确地按照指定的相机轨迹创建视频,生成包含多视角信息的潜在特征,同时保持三维一致性。
  • 双分支相机控制机制:利用ControlNet和LoRA模块,Wonderland实现了在视频生成过程中对于丰富的相机视角变化的精确控制,显著提升了多视角生成的视频质量、几何一致性和静态特征。
  • 大规模latent-based 3D重建模型(LaLRM):Wonderland创新地引入了3D重建模型LaLRM,利用视频生成模型生成的latent直接重构3D场景(feed-forward reconstruction)。重建模型的训练采用了高效的逐步训练策略,将视频latent空间中的信息转化为3D高斯点分布(3D Gaussian Splatting, 3DGS),显著降低了内存需求和重建时间成本。
  • 从单张图像到三维世界的关键创新:传统的3D重建技术往往依赖于多视角数据或逐个场景的优化,且在处理背景和不可见区域时容易失真。Wonderland通过结合视频生成模型和大规模3D重建模型,实现了高效高质量的大规模3D场景生成。
  • 向视频扩散模型中嵌入3D意识:通过向视频扩散模型中引入相机位姿控制,Wonderland在视频latent空间中嵌入了场景的多视角信息,并能保证3D一致性。

Wonderland的项目地址

  • 项目官网:https://snap-research.github.io/wonderland
  • arXiv技术论文:https://arxiv.org/pdf/2412.12091

Wonderland的应用场景

  • 建筑设计:在建筑设计领域,Wonderland可以用于创建高质量的3D模型和场景,帮助设计师和客户更直观地理解和展示建筑设计。
  • 虚拟现实(VR):在虚拟现实领域,Wonderland可以生成广范围的3D场景,为用户提供沉浸式体验,适用于虚拟旅游、教育训练等应用。
  • 影视特效:Wonderland的技术可以用于生成高质量的3D场景和视频,为电影和电视制作提供更加逼真的特效和背景。
  • 游戏开发:在游戏开发领域,Wonderland可以用于快速生成游戏环境和场景,提高游戏开发的效率和质量。
  • 商业演示:企业可以用Wonderland创建引人入胜的产品演示,构建虚拟商店、在线展览等,为客户提供全新的购物体验。
  • 虚拟产品演示:电子产品制造商可以开发虚拟演示系统,让用户在购买前体验产品的各项功能,包括外观设计、硬件配置和软件应用等。
DualPipe – DeepSeek 开源的双向流水线并行技术
字节跳动Seed3D 2.0发布:单图生成生产级3D资产,几何精度与PBR材质双SOTA
Nanobrowser – AI网页自动化工具,自主完成复杂的网页任务
GPT-4o mini TTS – OpenAI 推出的文本转语音模型
Roop-Unleashed – AI换脸工具,支持批量换脸、VR换脸、直播换脸
分享
Email 复制链接 打印
Share
上一篇 MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法
AIGC 资讯
WiseDiag – 杭州智诊科技推出全球领先的医疗大模型
AIGC 资讯
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
AIGC 资讯
HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型
AIGC 资讯

相关推荐

AIGC 资讯

Multi-SWE-bench – 字节豆包开源的多语言代码修复基准

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯

谷歌AI翻车!竟把’Google’拼错,大模型‘不识字’的硬伤藏不住了

站外新闻
AI摘要 Transformer 大语言模型 词元 谷歌
量子芯片科技感占位特色图
AI 工具AIGC 资讯

7500万美元收购StackAI!Asana剑指人机协作操作系统,AI原生办公时代来了?

站外新闻
AI原生平台 Asana StackAI 人机协作 工作流自动化
AIGC 资讯

GPT-4.1 – OpenAI 推出新一代语言模型,支持百万 token 上下文

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.