Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Scenethesis – 英伟达推出的交互式3D场景生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Scenethesis – 英伟达推出的交互式3D场景生成框架
AIGC 资讯

Scenethesis – 英伟达推出的交互式3D场景生成框架

站外新闻
最近更新: 2026年6月8日 上午12:29
SHARE

Scenethesis是什么

Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基于多阶段流程实现高效生成,用 LLM 进行粗略布局规划,基于视觉模块细化布局生成图像指导,用优化模块调整物体姿态确保物理合理性,基于判断模块验证场景的空间连贯性。Scenethesis 能生成多样化的室内外场景,具有高度的真实感和物理合理性,广泛应用在虚拟内容创作、仿真环境和具身智能研究等领域。

阅读目录
  • Scenethesis是什么
  • Scenethesis的主要功能
  • Scenethesis的技术原理
  • Scenethesis的项目地址
  • Scenethesis的应用场景

Scenethesis

Scenethesis的主要功能

  • 文本生成3D场景:用户输入文本描述,AI自动生成对应的3D场景。
  • 物理合理性:生成的场景物体不会相互穿透,能稳定放置,符合物理规则。
  • 用户交互:用户能调整物体位置、大小等,场景实时更新。
  • 多样化场景与物体库:支持多种室内外场景,包含丰富3D模型供选择。
  • 场景验证:自动检查场景质量,必要时重新生成优化,确保高质量输出。

Scenethesis的技术原理

  • 粗略布局规划(LLM模块):用户输入文本描述后,LLM对文本进行解析,理解场景的主题和关键元素。LLM从预定义的3D模型库中选择与场景描述相关的物体,生成一个粗略的布局计划。LLM生成详细的提示,描述场景中物体的初步位置和关系,为后续的视觉细化提供基础。
  • 视觉细化(视觉模块):根据LLM生成的提示,视觉模块(如基于扩散模型的图像生成器)生成详细的图像,作为场景布局的视觉指导。基于预训练的视觉基础模型(如Grounded-SAM和DepthPro)对生成的图像进行分割和深度估计,提取场景图,包括物体的3D边界框和空间关系。根据场景图和提示,从3D模型库中检索与场景描述匹配的3D物体模型。
  • 物理优化(物理优化模块):基于语义对应匹配技术(如RoMa)对3D模型和图像指导中的物体进行姿态对齐,确保物体的位置、尺寸和方向与图像指导一致。用有符号距离场(SDF)技术检测物体之间的碰撞,调整物体的位置和尺寸,避免碰撞。
  • 场景验证(场景验证模块):基于预训练的语言模型评估生成场景的空间连贯性,确保物体的位置和关系符合常识。如果评估结果不满足要求,系统将触发重新规划和优化过程,直到生成的场景达到高质量标准。

Scenethesis的项目地址

  • 项目官网:https://research.nvidia.com/labs/dir/scenethesis/
  • arXiv技术论文:https://arxiv.org/pdf/2505.02836

Scenethesis的应用场景

  • 虚拟现实(VR)/增强现实(AR):创建沉浸式虚拟环境,如虚拟旅游或展厅。
  • 游戏开发:快速生成游戏关卡和虚拟世界,提高开发效率。
  • 具身智能:为AI训练提供逼真的虚拟场景,如家庭环境。
  • 虚拟内容创作:生成电影、动画或广告的场景原型,加速创作流程。
  • 教育和培训:模拟实验室或培训场景,用于教学和技能练习。
麦橘超然 – 麦橘推出的AI文生图模型,基于 Flux.1 架构
阿里通义发布Qwen3Guard:全球首款支持119种语言的大模型安全防护标杆
AIGC 基础知识
WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型
SPARK2026腾讯游戏发布会重磅盘点:超40款游戏动态与AI技术全面革新
分享
Email 复制链接 打印
Share
上一篇 MedReason – 美国加州联合南洋理工等机构推出的医学推理框架
下一篇 Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯
华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

可灵2.0 – 快手推出的新一代AI视频生成模型

站外新闻
AI 工具AIGC 资讯

蚂蚁集团开源Ming-Flash-Omni 2.0:100B参数全模态大模型如何重塑AI交互?

站外新闻
AIGC MoE架构 多模态 蚂蚁集团
AI 工具AIGC 资讯

腾讯混元HunyuanVideo-Foley开源:AI视频音效生成模型,多模态扩散变换器驱动沉浸式创作

站外新闻
AIGC AI视频工具 多模态模型 腾讯混元 音效生成
量子芯片科技感占位特色图
AI 工具AIGC 资讯最新趋势

软银微软强强联手:Azure AI打造全自动呼叫中心,破解日本劳动力困局

站外新闻
AI智能体 Azure AI 企业服务自动化 全自动呼叫中心 软银
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.