Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景
AIGC 资讯

PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景

站外新闻
最近更新: 2026年6月8日 上午2:57
SHARE

PhysGen3D是什么

PhysGen3D 是创新的框架,能将单张图像转换为交互式的 3D 场景,生成具有物理真实感的视频。结合了基于图像的几何和语义理解以及基于物理的模拟,通过从单张图像中推断物体的 3D 形状、姿态、物理和光照属性,创建出以图像为中心的数字孪生。再基于物质点方法(MPM)模拟物体的反事实物理行为,最终将动态效果无缝整合到原始图像中,生成视觉逼真的结果。

阅读目录
  • PhysGen3D是什么
  • PhysGen3D的主要功能
  • PhysGen3D的技术原理
  • PhysGen3D的项目地址
  • PhysGen3D的应用场景

PhysGen3D

PhysGen3D的主要功能

  • 从单张图像创建交互式 3D 场景:PhysGen3D 能将单张图像转换为可交互的 3D 场景,用户可以在这个场景中模拟不同的物理行为。
  • 精确控制物体的初始条件:用户可以指定物体的速度、材质属性等初始条件,从而对生成视频的结果进行精细控制。
  • 生成具有物理真实感的视频:通过结合基于图像的几何和语义理解以及基于物理的模拟,PhysGen3D 可以生成在动态和光照方面视觉逼真且物理上合理的视频。
  • 密集 3D 跟踪:可以对场景中的物体进行精确的 3D 跟踪。
  • 视频编辑:能够在不同场景之间交换物体,或者在保持物体初始位置不变的情况下移除某些物体。
  • 相机控制:支持从不同视角生成视频。
  • 从绘画生成视频:可以处理生成的图像和绘画等其他类型的输入,并生成视频。

PhysGen3D的技术原理

  • 3D 场景重建:PhysGen3D 从单张图像出发,通过先进的基于图像的几何和语义理解技术,推断出物体的 3D 形状、姿态、物理和光照属性,同时重建背景的几何和外观。基于多种预训练的视觉模型,将它们的输出整合起来,创建出以图像为中心的数字孪生。
  • 物理模拟:在物理模拟方面,PhysGen3D 采用了物质点方法(MPM),是一种基于点 – 体素的框架,用于模拟图像中物体的反事实物理行为。通过精确推断物体的物理属性,PhysGen3D 能在模拟环境中实现高度的真实感和稳定性。用户可以指定物体的速度、材质属性等初始条件,对生成视频的结果进行精细控制。
  • 基于物理的渲染:完成动态模拟后,PhysGen3D 通过运动插值计算顶点运动,变形网格,使用优化的基于物理的渲染(PBR)材料,在环境光照下利用 Mitsuba3 进行基于物理的渲染。为了避免将整个静态背景转换到渲染管线中,PhysGen3D 构建了一个 3D 阴影捕捉表面,采用两遍阴影映射技术提取阴影和全局光照效果,最后将前景物体和阴影合成到修复后的背景上,生成最终的视频。

PhysGen3D的项目地址

  • 项目官网:https://by-luckk.github.io/PhysGen3D/
  • Github仓库:https://github.com/by-luckk/PhysGen3D
  • arXiv技术论文:https://arxiv.org/pdf/2503.20746

PhysGen3D的应用场景

  • 影视制作与特效:PhysGen3D 可以用于影视制作中的特效生成,帮助创作者快速构建具有物理真实感的动态场景。
  • 虚拟现实与增强现实:在虚拟现实(VR)和增强现实(AR)应用中,PhysGen3D 能从单张图像生成交互式的 3D 场景,为用户提供沉浸式的体验。
  • 教育与培训:PhysGen3D 可以用于教育领域,帮助学生更好地理解物理概念。
  • 游戏开发:PhysGen3D 为游戏开发提供了新的可能性。开发者可以从单张图像生成具有物理真实感的动态场景的能力,快速构建游戏中的关卡和场景。
  • 广告与营销:在广告和营销领域,PhysGen3D 可以用于生成吸引人的动态广告内容。从产品照片生成动态视频,展示产品的使用场景和物理特性,吸引消费者的注意力。
腾讯CL-bench震撼发布:AI学习能力基准测试,GPT-5.1解决率仅23.7%暴露行业瓶颈
OpenAI Codex重磅更新:Mac锁屏也能自动执行任务,开发者生产力迎来颠覆式提升
混元图像2.0 – 腾讯推出的实时AI图片生成大模型
AI攻破6大数学猜想!25岁华人少女退学创业,OpenAI都未曾实现,她凭什么拿下14亿融资?
Cube 3D – Roblox 推出的 AI 3D 生成模型
分享
Email 复制链接 打印
Share
上一篇 GPT-4.1 – OpenAI 推出新一代语言模型,支持百万 token 上下文
下一篇 Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI 工具 AIGC 资讯
阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

阿里重磅开源!AgentScope Java框架:为Java开发者量身打造的生产级智能体开发利器

站外新闻
Java 开源框架 阿里巴巴
AI 工具AIGC 资讯

IBM发布258M参数轻量级视觉语言模型:高效文档转换,支持多语言与复杂版式

站外新闻
IBM 企业级应用 多模态AI 文档转换 视觉语言模型
AI 工具AIGC 资讯

字节跳动Depth Anything 3发布:单一Transformer架构突破三维空间重建,精度与速度双领先

站外新闻
Depth Anything 3 Transformer 三维空间重建 字节跳动 计算机视觉
AI 工具AIGC 资讯

abogen:开源AI文本转语音新标杆,支持同步字幕生成,解锁有声书与视频创作效率

站外新闻
AI文本转语音 Kokoro模型 内容创作 同步字幕 开源工具
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.