Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型
AIGC 资讯

Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型

站外新闻
最近更新: 2026年6月8日 下午2:11
SHARE

Amodal3R是什么

Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,利用遮挡先验知识指导重建过程。Amodal3R 仅使用合成数据进行训练,能在真实场景中表现出色,显著优于现有的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建树立了新的基准。

阅读目录
  • Amodal3R是什么
  • Amodal3R的主要功能
  • Amodal3R的技术原理
  • Amodal3R的项目地址
  • Amodal3R的应用场景

Amodal3R

Amodal3R的主要功能

  • 遮挡感知 3D 重建:针对遮挡严重的 2D 图像,Amodal3R 能结合 2D 片段信息与语义推测,生成完整的 3D 模型。
  • 超越现有方法:相比于“2D 预测补全 + 3D 重建”两步法,Amodal3R 在遮挡情况下表现更优,建立了新的 3D 重建基准。

Amodal3R的技术原理

  • 基础 3D 生成模型扩展:Amodal3R 从一个“基础”3D 生成模型出发,通过扩展能处理遮挡的 2D 图像,恢复出合理的 3D 几何形状和外观。
  • 掩码加权多头交叉注意力机制:模型引入了掩码加权多头交叉注意力机制,能更好地处理遮挡问题。具体来说,通过掩码来引导注意力机制,使模型在生成过程中更加关注可见部分,利用遮挡先验知识来推测被遮挡区域的形状和纹理。
  • 遮挡感知注意力层:在掩码加权多头交叉注意力机制之后,Amodal3R 引入了遮挡感知注意力层。
  • 基于 DINOv2 的特征提取:Amodal3R 利用 DINOv2 进行高质量的视觉特征提取。DINOv2 提供的特征能为 3D 重建提供更多上下文信息,帮助模型更准确地进行 3D 重建。
  • 合成数据训练与泛化能力:Amodal3R 仅使用合成数据进行训练,能学习到在真实场景中即使存在遮挡也能恢复完整 3D 对象的能力。表明模型具有较强的泛化能力,能将从合成数据中学到的知识应用到真实场景中。

Amodal3R的项目地址

  • 项目官网:https://sm0kywu.github.io/Amodal3R/
  • HuggingFace模型库:https://huggingface.co/Sm0kyWu/Amodal3R
  • arXiv技术论文:https://arxiv.org/pdf/2503.13439

Amodal3R的应用场景

  • 增强现实(AR)和虚拟现实(VR):在 AR 和 VR 应用中,Amodal3R 可以帮助从部分可见的 2D 图像中重建完整的 3D 模型,提供更加沉浸式的体验。
  • 机器人视觉:机器人在复杂环境中操作时,会遇到物体被部分遮挡的情况。Amodal3R 可以帮助机器人更准确地感知和理解环境中的物体,更好地进行路径规划和任务执行。
  • 自动驾驶:在自动驾驶领域,车辆需要实时感知周围环境中的物体。Amodal3R 可以从部分遮挡的图像中重建完整的 3D 模型,帮助自动驾驶系统更准确地识别和处理复杂的交通场景。
  • 3D 资产创建:在游戏开发、电影制作和其他需要 3D 资产的领域,Amodal3R 可以从简单的 2D 图像中生成高质量的 3D 模型,简化了 3D 建模的流程。
  • 学术研究:Amodal3R 为计算机视觉和 3D 重建领域的研究提供了新的工具和方法。研究人员可以用模型探索更复杂的场景和更高效的重建算法。
阿里通义EAPO框架:30B小模型反超120B闭源大模型的强化学习突破,ACL 2026论文详解
Anthropic 最强模型 Mythos 即将解禁:AI 网络安全攻防战进入纳秒级“深水区”
Bolt3D – 牛津大学联合谷歌推出的 3D 场景生成技术
Scenethesis – 英伟达推出的交互式3D场景生成框架
法拉利与IBM联手:生成式AI重塑F1车迷体验,App活跃度飙升62%
分享
Email 复制链接 打印
Share
上一篇 ​谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划
下一篇 高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已开放内测
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Skywork-VL Reward – Skywork AI开源的多模态奖励模型
AIGC 资讯
高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已开放内测
AIGC 资讯
​谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划
AIGC 资讯
反超美国!中国AI大模型周调用量创新高,包揽全球前四
AIGC 资讯

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

渣打银行裁员8000人:AI替代低价值人力,银行业‘冰冷转型’下的人类岗位危机

站外新闻
AI裁员 人力替代 大模型应用 渣打银行 银行业转型
AIGC 资讯

DeepSeek-R1T-Chimera – TNG开源的语言模型

站外新闻
AIGC 资讯

风宇 – 中国气象局联合华为和南昌大学推出的空间天气大模型

站外新闻
AIGC 资讯

TripoSR – Stability AI 联合 VAST 开源的 3D 生成模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.