Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型
AIGC 资讯

Amodal3R – 南洋理工联合牛津等推出的条件式 3D 生成模型

站外新闻
最近更新: 2026年6月8日 下午2:11
SHARE

Amodal3R是什么

Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,利用遮挡先验知识指导重建过程。Amodal3R 仅使用合成数据进行训练,能在真实场景中表现出色,显著优于现有的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建树立了新的基准。

阅读目录
  • Amodal3R是什么
  • Amodal3R的主要功能
  • Amodal3R的技术原理
  • Amodal3R的项目地址
  • Amodal3R的应用场景

Amodal3R

Amodal3R的主要功能

  • 遮挡感知 3D 重建:针对遮挡严重的 2D 图像,Amodal3R 能结合 2D 片段信息与语义推测,生成完整的 3D 模型。
  • 超越现有方法:相比于“2D 预测补全 + 3D 重建”两步法,Amodal3R 在遮挡情况下表现更优,建立了新的 3D 重建基准。

Amodal3R的技术原理

  • 基础 3D 生成模型扩展:Amodal3R 从一个“基础”3D 生成模型出发,通过扩展能处理遮挡的 2D 图像,恢复出合理的 3D 几何形状和外观。
  • 掩码加权多头交叉注意力机制:模型引入了掩码加权多头交叉注意力机制,能更好地处理遮挡问题。具体来说,通过掩码来引导注意力机制,使模型在生成过程中更加关注可见部分,利用遮挡先验知识来推测被遮挡区域的形状和纹理。
  • 遮挡感知注意力层:在掩码加权多头交叉注意力机制之后,Amodal3R 引入了遮挡感知注意力层。
  • 基于 DINOv2 的特征提取:Amodal3R 利用 DINOv2 进行高质量的视觉特征提取。DINOv2 提供的特征能为 3D 重建提供更多上下文信息,帮助模型更准确地进行 3D 重建。
  • 合成数据训练与泛化能力:Amodal3R 仅使用合成数据进行训练,能学习到在真实场景中即使存在遮挡也能恢复完整 3D 对象的能力。表明模型具有较强的泛化能力,能将从合成数据中学到的知识应用到真实场景中。

Amodal3R的项目地址

  • 项目官网:https://sm0kywu.github.io/Amodal3R/
  • HuggingFace模型库:https://huggingface.co/Sm0kyWu/Amodal3R
  • arXiv技术论文:https://arxiv.org/pdf/2503.13439

Amodal3R的应用场景

  • 增强现实(AR)和虚拟现实(VR):在 AR 和 VR 应用中,Amodal3R 可以帮助从部分可见的 2D 图像中重建完整的 3D 模型,提供更加沉浸式的体验。
  • 机器人视觉:机器人在复杂环境中操作时,会遇到物体被部分遮挡的情况。Amodal3R 可以帮助机器人更准确地感知和理解环境中的物体,更好地进行路径规划和任务执行。
  • 自动驾驶:在自动驾驶领域,车辆需要实时感知周围环境中的物体。Amodal3R 可以从部分遮挡的图像中重建完整的 3D 模型,帮助自动驾驶系统更准确地识别和处理复杂的交通场景。
  • 3D 资产创建:在游戏开发、电影制作和其他需要 3D 资产的领域,Amodal3R 可以从简单的 2D 图像中生成高质量的 3D 模型,简化了 3D 建模的流程。
  • 学术研究:Amodal3R 为计算机视觉和 3D 重建领域的研究提供了新的工具和方法。研究人员可以用模型探索更复杂的场景和更高效的重建算法。
阿里通义Wan2.5重磅发布:音画同步视频+1080P创作,多模态生成进入新纪元
阿里开源Zvec:轻量级嵌入式向量数据库,毫秒级搜索十亿向量,RAG/图像搜索场景首选
LangFlow – AI应用构建工具,拖拽组件创建复杂工作流
英伟达开源OpenReasoning-Nemotron:基于DeepSeek蒸馏,数学推理超越o3,本地部署全攻略
Seedance 1.0 lite – 火山引擎推出的视频生成模型
分享
Email 复制链接 打印
Share
上一篇 ​谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划
下一篇 高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已开放内测
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

智谱GLM-4.5开源SOTA模型发布:MoE架构引领效率革命,价格仅Claude十分之一

站外新闻
GLM-4.5 MoE架构 开源大模型 智谱AI
AI 工具AIGC 资讯

亚马逊重磅发布Nova 2系列AI模型:四款神器覆盖文本、语音、视频,百万级上下文处理引领多模态革命

站外新闻
Amazon Nova 2 AWS 企业级AI 多模态AI
AIGC 资讯

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

站外新闻
AI 工具AIGC 资讯

陈天桥团队重磅开源EverMemOS:AI长期记忆操作系统,让AI像人脑一样记忆

站外新闻
AI记忆系统 EverMemOS 盛大 长期记忆 陈天桥
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.