Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯混元3D世界模型2.0全面开源:一键文图生3D场景,兼容UE/Unity引擎,性能对标商业产品
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 腾讯混元3D世界模型2.0全面开源:一键文图生3D场景,兼容UE/Unity引擎,性能对标商业产品
AI 工具AIGC 资讯

腾讯混元3D世界模型2.0全面开源:一键文图生3D场景,兼容UE/Unity引擎,性能对标商业产品

站外新闻
最近更新: 2026年5月25日 下午10:29
3D世界模型 3D高斯溅射 AIGC 开源大模型 腾讯混元
SHARE

💡 站外导读:随着AIGC和空间计算的融合,从文本/图像自动生成高质量3D世界成为行业新焦点。然而,传统3D内容制作门槛高、周期长,且生成场景缺乏物理真实感与可交互性,难以直接应用于游戏开发、机器人仿真等领域。腾讯混元此次开源HY-World 2.0,旨在打通从多模态输入到物理可交互3D世界的全链路,降低产业应用门槛。

混元3D世界模型 2.0是什么

混元3D世界模型 2.0(HY-World 2.0)是腾讯混元推出的开源多模态世界模型,支持从文本、单图、多视图或视频生成可漫游的3D高斯溅射(3DGS)场景。模型采用四阶段架构,全景生成→轨迹规划→世界扩展→3D重建,实现”文/图生3D世界”与”视频重建3D世界”的统一。混元3D世界模型 2.0生成场景支持物理碰撞、角色探索,可导出至Unity/UE引擎,性能对标闭源商业产品Marble。

阅读目录
  • 混元3D世界模型 2.0是什么
  • 混元3D世界模型 2.0的主要功能
  • 混元3D世界模型 2.0的技术原理
  • 如何使用混元3D世界模型 2.0
  • 混元3D世界模型 2.0的关键信息和使用要求
  • 混元3D世界模型 2.0的核心优势
  • 混元3D世界模型 2.0的项目地址
  • 混元3D世界模型 2.0的同类竞品对比
  • 混元3D世界模型 2.0的应用场景
      • 📝 站长洞察 (Editor’s Insight)

HY-World 2.0

混元3D世界模型 2.0的主要功能

  • 世界生成:基于文本或单张图片生成360°可漫游的3DGS/Mesh沉浸式场景。
  • 世界重建:从多视图图像或视频输入重建高保真3D数字孪生空间。
  • 全景图生成:将任意视角图片或文字转换为360°全景图(HY-Pano 2.0)。
  • 轨迹智能规划:解析场景语义并规划探索路径,避免穿墙等不合理行为(WorldNav)。
  • 角色冒险模式:支持操控角色在生成场景中自由行走探索。
  • 多格式导出:支持3DGS、Mesh、点云、视频等多种格式及主流引擎对接。

混元3D世界模型 2.0的技术原理

  • 全景图生成(HY-Pano 2.0):采用端到端隐式学习方案,通过多模态Diffusion Transformer(MMDiT)自主学习从透视图到360°等距圆柱投影(ERP)的空间映射,无需相机元数据。引入圆形填充(Circle Padding)和像素混合技术解决ERP边界不连续问题,结合真实全景+UE合成数据混合训练。
  • 轨迹规划(WorldNav):通过几何与语义场景解析(点云、Mesh、语义分割、NavMesh)理解空间结构,智能规划最大化信息覆盖的漫游轨迹,确保路径自然且避开障碍物,支持常规、环绕、重建感知、漫游、空中等多样化轨迹类型。
  • 世界扩展(WorldStereo 2.0):基于关键帧生成而非连续视频生成,引入全局几何记忆和空间立体记忆机制,确保多视角一致性。通过模型蒸馏提升效率,实现沿规划路径的场景扩展与细节补全。
  • 世界重建(WorldMirror 2.0):采用前馈式3D预测模型,通过归一化位置编码、显式法线监督和深度掩码预测优化几何精度。结合3D高斯溅射(3DGS)进行最终场景融合与优化,支持从生成视图和真实输入进行鲁棒重建。

如何使用混元3D世界模型 2.0

  • 访问平台:访问腾讯混元3D官网登录账号。。
  • 选择输入方式:上传单张图片(支持任意视角)或输入文本描述(如”赛博朋克风格的街道,霓虹灯闪烁”)
  • 参数配置:选择生成模式(世界生成/世界重建)、场景风格、漫游范围等参数。
  • 生成与探索:点击生成后,系统自动执行四阶段流程(全景→轨迹→扩展→重建)。
  • 导出使用:支持下载3DGS/Mesh文件或直接生成Unity/UE引擎可导入的资产包。

混元3D世界模型 2.0的关键信息和使用要求

  • 开发团队:腾讯混元(Tencent Hunyuan)研发推出。
  • 开源情况:模型权重、训练代码及完整技术报告已全面开源,可自由下载研究。
  • 输入模态:支持文本提示、单张图片、多视角图片以及视频流四种输入方式。
  • 输出格式:可导出3D高斯溅射(3DGS)、网格模型(Mesh)、点云数据、360°全景图及视频序列。
  • 引擎支持:生成资产原生兼容Unity和Unreal Engine(UE),可直接导入二次编辑。
  • 硬件要求:本地部署需配备NVIDIA GPU,建议使用显存≥16GB的环境以保证生成效率。

混元3D世界模型 2.0的核心优势

  • 生成与重建统一:首个开源框架同时支持”无中生有”(生成)和”从实到虚”(重建)两种范式。
  • 物理可交互:生成场景具备空间逻辑和物理碰撞检测,支持角色操控探索。
  • 无需相机参数:全景生成阶段无需焦距、FOV等元数据,适应真实场景图片。
  • 高质量边界处理:360°全景无缝衔接,无传统ERP图像的左右边界断裂问题。
  • 记忆一致性:世界扩展阶段引入记忆机制,确保长轨迹漫游的视觉连贯性。
  • 工业级兼容:原生支持主流游戏引擎,可直接用于游戏开发和机器人仿真。

混元3D世界模型 2.0的项目地址

  • 项目官网:https://3d-models.hunyuan.tencent.com/world/
  • GitHub仓库:https://github.com/Tencent-Hunyuan/HY-World-2.0
  • HuggingFace模型库:https://huggingface.co/tencent/HY-World-2.0
  • 技术论文:https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf

混元3D世界模型 2.0的同类竞品对比

对比维度 混元3D世界模型 2.0 WonderWorld Marble
开发方 腾讯混元 Snap Research / UC Berkeley World Labs(李飞飞)
开源状态 完全开源(权重+代码) 开源(研究代码) 闭源/有限开放
输入模态 文本/单图/多视图/视频 单图/文本 单图/文本
核心输出 3DGS/Mesh 3DGS 3DGS
生成与重建 统一支持 侧重生成 侧重生成
物理交互 支持角色漫游+碰撞检测 基础漫游 基础探索
引擎导出 Unity/UE原生支持 需转换 有限支持
全景生成 HY-Pano 2.0(无相机参数需求) 需已知相机位姿 依赖深度估计

混元3D世界模型 2.0的应用场景

  • 游戏开发领域:开发者可用模型快速生成具备物理碰撞的可交互3D场景原型,显著降低传统关卡设计的时间和技术门槛。
  • 虚拟现实应用:系统能构建高保真沉浸式VR/AR空间,支持终端用户在生成环境中实现自由行走和实时探索。
  • 数字孪生构建:用户仅需提供少量照片或短视频即可自动重建真实物理世界的高精度3D数字副本。
  • 机器人仿真训练:为具身智能和自动驾驶系统提供物理一致、可交互的虚拟训练环境,支持算法安全验证。
  • 影视虚拟制片:模型能生成360°全景虚拟背景资产,用于电影预演、虚拟摄影棚拍摄及后期特效合成制作。

📝 站长洞察 (Editor’s Insight)

腾讯混元3D世界模型2.0的开源,标志着生成式AI正从2D内容创作快速迈向高保真、物理可交互的3D世界构建。其将“生成”与“重建”统一在一个框架内,并实现工业级引擎兼容,这直接瞄准了游戏开发、虚拟现实和机器人仿真的核心生产流程。该模型不仅是技术上的突破,更体现了“AI原生”3D工作流正在形成:从创意到可部署资产的全自动化。尤其值得注意的是其无需相机参数的全景生成和智能轨迹规划,这解决了真实场景重建中的关键痛点。随着此类工具的成熟,我们或将看到3D内容创作的“平民化”,以及虚拟世界构建速度的指数级提升,为元宇宙、具身智能等前沿领域提供关键基础设施。

AIChatting聊天机器人
GPT-5.6意外曝光:150万token上下文窗口破纪录,商用级前端生成引发AI巨头新一轮遭遇战
GoatChat AI聊天机器人
象寄翻译
港大OpenHarness开源:仅1.1万行代码复刻98% Claude Code功能,轻量级AI Agent框架新标杆
TAGGED:3D世界模型3D高斯溅射AIGC开源大模型腾讯混元
分享
Email 复制链接 打印
Share
上一篇 阶跃星辰StepAudio 2.5 TTS发布:语境感知AI语音合成,3秒克隆音色,告别‘AI味’朗读
下一篇 量子芯片科技感占位特色图 商汤Seko AI重磅升级:发布Seko Space,以‘创编一体’技术重塑漫短剧工业化生产链路
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

字节跳动Seeduplex全双工语音模型上线:边听边说、误打断率降50%,豆包App亿级用户体验实时AI对话
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
全球AI监管转向:多国强推『上线前安检』,大模型安全评估新机制如何落地?
AIGC 资讯
流光脑波AI大脑占位特色图
乔治·霍茨重磅警告:AI编程智能体或成软件行业最大代价,过度依赖是致命陷阱
AIGC 资讯 最新趋势
智元机器人发布GO-2具身智能大模型:首创动作思维链+异步双系统,LIBERO基准测试全面SOTA
AI 工具 AIGC 资讯

相关推荐

AI 工具

Sticky

remaker
AI 工具

Syne XR

remaker
AI 工具

Face26

remaker
AI 工具AIGC 资讯

美团万亿参数大模型LongCat-2.0-Preview:国产芯片训推闭环破局,1M上下文免费开放内测

站外新闻
MoE架构 万亿参数 国产算力 大模型 美团
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI安全 AI工具 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos DALL-E3 DeepSeek Gemini GPT-5.5 meta Midjourney MoE MoE架构 MoE模型 NVIDIA openai Pika prompt Qwen3.7-Max stable diffusion SWE-Bench Token Pay xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 办公自动化 华为昇腾 咒语 商汤科技 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 女性 字节跳动 室内设计 家居 展台 建筑 建筑设计 开发者工具 开源 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 提示词 支付宝 教程 新加坡 新闻 早报 智能体 智能体编程 月之暗面 海报设计 游戏 生成式AI 破碎 科幻 窗 端侧AI 网络安全 背景 腾讯混元 英伟达 视频编辑 语音合成 赛博朋克 运动 阶跃星辰 阿里通义 阿里通义千问 风景 马斯克
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.