Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DynamicCity – 上海 AI Lab 推出的4D动态场景生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DynamicCity – 上海 AI Lab 推出的4D动态场景生成框架
AIGC 资讯

DynamicCity – 上海 AI Lab 推出的4D动态场景生成框架

站外新闻
最近更新: 2026年6月9日 上午4:01
SHARE

DynamicCity是什么

DynamicCity 是上海AI Lab推出的大规模动态场景生成的4D生成框架。DynamicCity 专注于生成具有语义信息的动态 LiDAR 场景,能处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据。DynamicCity基于 VAE 模型将 4D 场景编码为紧凑的 HexPlane 表示,用基于扩散模型(DiT)的生成器重建动态场景。DynamicCity 框架支持多种应用,如轨迹引导、指令驱动生成和动态场景修复。DynamicCity 在 CarlaSC 和 Occ3D-Waymo 数据集上表现出色,显著优于现有方法,展现了在高质量动态场景生成中的强大能力,为自动驾驶和机器人技术提供了有力支持。

阅读目录
  • DynamicCity是什么
  • DynamicCity的主要功能
  • DynamicCity的技术原理
  • DynamicCity的项目地址
  • DynamicCity的应用场景

DynamicCity

DynamicCity的主要功能

  • 高质量 4D 场景生成:生成大规模、高质量的动态 LiDAR 场景,捕捉真实世界环境中动态变化的时空演变。支持长达 128 帧的长序列生成,能模拟复杂的动态环境。
  • 多样化下游应用:
    • 轨迹引导生成:基于输入特定的轨迹,控制场景中对象的运动。
    • 指令驱动生成:基于指令(如“左转”、“右转”、“前进”)控制自车或场景的运动。
    • 动态场景修复(Inpainting):对部分缺失或损坏的场景进行修复,生成完整的动态场景。
    • 布局条件生成:基于鸟瞰图布局控制车辆和其他对象的放置。

DynamicCity的技术原理

  • VAE 模型:
    • 编码阶段:将 4D LiDAR 场景编码为紧凑的 HexPlane 表示。基于 3D 卷积神经网络提取特征,用 Projection Module 将 4D 特征压缩为六个 2D 特征图。提升 HexPlane 的拟合质量(最高提升 12.56% 的 mIoU)。
    • 解码阶段:基于 Expansion & Squeeze Strategy (ESS) 并行解码 HexPlane,重建 3D 特征体积。相比逐点查询的方法,ESS 提升了拟合质量(最高提升 7.05% 的 mIoU),加快了训练速度(最高提升 2.06 倍)减少了内存使用(最高减少 70.84%)。
  • DiT 模型:
    • HexPlane 生成:基于编码后的 HexPlane,DiT 模型用于生成新的 HexPlane,实现 4D LiDAR 场景的生成。为使 HexPlane 适用于 DiT 生成,提出 Padded Rollout Operation (PRO),将六个特征平面重新组织为一个方形 2D 特征图,高效地建模了特征序列中的空间和时间关系。
    • 条件生成:DiT 支持基于条件注入(如轨迹、指令、布局等)实现多样化的 4D 场景生成应用。 Classifier-Free Guidance (CFG),模型在训练时同时学习条件生成和无条件生成,在生成过程中实现更精细的控制。

DynamicCity的项目地址

  • 项目官网:https://dynamic-city.github.io/
  • GitHub仓库:https://github.com/3DTopia/DynamicCity
  • arXiv技术论文:https://arxiv.org/pdf/2410.18084

DynamicCity的应用场景

  • 自动驾驶仿真:生成复杂动态场景,用于自动驾驶算法的开发和测试,提升系统安全性。
  • 虚拟现实:创建逼真的虚拟环境,支持 VR 和 AR 应用,如虚拟驾驶和城市规划展示。
  • 机器人导航:模拟三维动态环境,帮助机器人进行路径规划和障碍物检测,增强适应性。
  • 交通流量分析:建模和分析交通流量,预测拥堵,优化交通信号和道路规划。
  • 智能城市规划:生成城市级动态场景,辅助评估城市布局和公共设施规划。
DCEdit – 北交大联合美图推出的双层控制图像编辑方法
Qwen3.6-Max-Preview深度评测:六大编程基准登顶,Agent编程能力超越Claude 4.5 Opus
小米发布万亿参数旗舰Agent大模型MiMo-V2-Pro:性能逼近Claude Opus,价格仅1/5
李飞飞团队ESI-Bench深度解读:AI如何从‘旁观者’进化为‘行动者’?具身智能新标杆揭示三大致命短板
NMT – 阿里联合 UC Berkeley 推出的多任务学习框架
分享
Email 复制链接 打印
Share
上一篇 Aya Vision – Cohere 推出多模态、多语言的视觉模型
下一篇 通古大模型 – 华南理工大学推出的古籍大语言模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DataClaw开源发布:一键导出AI对话,自动生成安全训练集,助力大模型微调
AI 工具 AIGC 资讯
OpenSandbox:阿里巴巴开源AI应用安全沙箱平台,为Agent与代码执行构建企业级隔离环境
AI 工具 AIGC 资讯
Goose:Block开源本地AI Agent框架,自主Debug、多模型切换,颠覆传统开发!
AI 工具 AIGC 资讯
阿里通义Fun-CosyVoice3.5重磅发布:一句话控制语气语速,13语种低延迟语音生成
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

复旦重磅发布LifeSim:全球首个长程用户生活模拟框架,革新AI助手评测与训练

站外新闻
AI助手评测 BDI认知模型 LifeSim 个性化AI 长程模拟
AIGC 资讯

Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯

颠覆性突破!全球首个多智能体AI科学家Robin 2小时完成900小时科研,登顶Nature

站外新闻
FutureHouse Robin AI科学家 多智能体AI系统 干性年龄相关黄斑变性 药物研发自动化
AIGC 资讯

SkyClaw-v1.0 – 昆仑万维天工AI推出的高性能Agent模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.