Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型
AIGC 资讯

GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型

站外新闻
最近更新: 2026年6月8日 下午11:30
SHARE

GEN3C是什么

GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存指导视频生成,用输入图像或视频帧的深度估计反投影生成 3D 场景,根据用户提供的相机轨迹渲染 2D 视频,作为生成模型的条件输入。GEN3C 的核心优势在于精确控制相机运动,避免传统方法中因缺乏显式 3D 建模导致的不一致性问题。GEN3C支持从单视角到多视角的视频生成,适用于静态和动态场景,在稀疏视图的新型视图合成任务中取得了最先进的结果。GEN3C 支持 3D 编辑和复杂相机运动(如推拉镜头)的生成,为视频创作和模拟提供了强大的工具。

阅读目录
  • GEN3C是什么
  • GEN3C的主要功能
  • GEN3C的技术原理
  • GEN3C的项目地址
  • GEN3C的应用场景

GEN3C

GEN3C的主要功能

  • 精确的相机控制:根据用户指定的相机轨迹生成视频,支持复杂的相机运动(如推拉镜头、旋转镜头等),保持视频的时空一致性。
  • 3D 一致性视频生成:支持生成具有真实感和一致性的视频,避免物体突然出现或消失等问题。
  • 多视角和稀疏视角的新型视图合成:支持从单视角、稀疏多视角到密集多视角的输入,生成高质量的新型视图视频。
  • 3D 编辑和场景操作:用户修改 3D 点云(如删除或添加物体)编辑场景,生成相应的视频。
  • 长视频生成:支持生成长视频,同时保持时空一致性。

GEN3C的技术原理

  • 构建 3D 缓存:输入图像或视频帧的深度估计反投影生成 3D 点云,形成时空一致的 3D 缓存。缓存作为视频生成的基础,提供场景的显式 3D 结构。
  • 渲染 3D 缓存:根据用户提供的相机轨迹,将 3D 缓存渲染成 2D 视频。
  • 视频生成:用预训练的视频扩散模型(如 Stable Video Diffusion 或 Cosmos),将渲染的 3D 缓存作为条件输入,生成高质量的视频。模型基于优化扩散过程中的去噪目标,修复渲染中的瑕疵填补缺失信息。
  • 多视角融合:当输入包含多个视角时,GEN3C 基于最大池化的融合策略,将不同视角的信息聚合到视频生成模型中,生成一致的视频。
  • 自回归生成和缓存更新:对于长视频生成,GEN3C 将视频分为多个重叠的块,逐块生成,更新 3D 缓存保持视频的时空一致性。

GEN3C的项目地址

  • 项目官网:https://research.nvidia.com/labs/toronto-ai/GEN3C/
  • GitHub仓库:https://github.com/nv-tlabs/GEN3C
  • arXiv技术论文:https://arxiv.org/pdf/2503.03751

GEN3C的应用场景

  • 单视角视频生成:从一张图片生成动态视频,适用于快速内容创作。
  • 新型视图合成:从少量视角生成新视角视频,用在VR/AR和3D重建。
  • 驾驶模拟:生成驾驶场景的不同视角视频,助力自动驾驶训练。
  • 动态视频重渲染:为已有视频生成新视角,用在视频编辑和二次创作。
  • 3D场景编辑:修改场景内容后生成新视频,助力影视制作和游戏开发。
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架
中国首个1.58-bit三值大模型BitCPM-CANN开源发布:显存降6倍,8B模型可跑在手机上
MiniMax Music 1.5 AI音乐生成模型:4分钟高质量作曲,解锁专业级人声与编曲新纪元
SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型
打破僵化API!Perplexity 推出“搜索即代码”,让 AI 智能体自主编写搜索管道
分享
Email 复制链接 打印
Share
上一篇 InfiniteYou – 字节跳动开源的身份保持图像生成框架
下一篇 HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

字节跳动发布SeedVR2:单步视频修复模型,以极低成本实现1080p高清画质革新
AI 工具 AIGC 资讯
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
AI 工具 AIGC 资讯
美团LLIA框架深度解析:实时音频驱动肖像视频生成,如何实现低延迟高保真交互?
AI 工具 AIGC 资讯
腾讯开源Hunyuan3D-2.1:工业级3D生成模型,支持PBR材质与多模态输入,1秒极速出图
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

Aider – 开源AI编程助手,基于命令行指定自动完成代码修改

站外新闻
AI 工具AIGC 资讯

Open Interpreter:本地运行代码的开源AI助手,让终端变身智能生产力引擎

站外新闻
AI终端助手 开发工具 开源项目 本地代码运行 自然语言处理
量子芯片科技感占位特色图
AI 工具AIGC 资讯

腾讯电脑管家Mac版重磅发布!首创AI安全沙箱,一文看懂如何守护AI智能体

站外新闻
AI安全沙箱 AI智能体 Mac安全防护 Prompt攻击 腾讯电脑管家
AI 工具AIGC 资讯

B站重磅开源IndexTTS2:全球首个精准时长控制TTS模型,零样本情感克隆多语言语音合成

站外新闻
AIGC B站开源 TTS模型 声音克隆 文本转语音
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.