Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式
AI 工具AIGC 资讯

VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式

站外新闻
最近更新: 2026年6月7日 下午8:08
4D几何控制 VerseCrafter 复旦大学 腾讯 视频生成
SHARE

💡 站外导读:在AIGC浪潮席卷全球的今天,如何从静态图像生成跃升至对动态场景的精准控制,是视频生成领域的核心痛点。传统模型常面临视角漂移、物体运动失真等难题,难以满足虚拟现实、游戏开发等应用对高一致性动态内容的需求。VerseCrafter应运而生,作为复旦与腾讯的开源力作,它首次将4D几何控制能力融入视频世界模型,旨在彻底解决动态场景生成中的时空一致性瓶颈,为下一代沉浸式内容创作铺平道路。

VerseCrafter是什么

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练,能处理复杂动态场景,保持强时空一致性。用户能指定相机轨迹和目标轨迹,生成高质量、几何一致的视频。模型能在视频生成、虚拟现实和游戏开发等领域具有广阔的应用前景。

阅读目录
  • VerseCrafter是什么
  • VerseCrafter的主要功能
  • VerseCrafter的技术原理
  • VerseCrafter的项目地址
  • VerseCrafter的应用场景
      • 📝 站长洞察 (Editor’s Insight)

VerseCrafter

VerseCrafter的主要功能

  • 4D几何控制:用户能通过指定相机轨迹和多目标的3D高斯轨迹,实现对视频中视角和物体运动的精确控制。
  • 灵活的控制模式:模型支持相机单独控制、目标单独控制及相机与目标的联合控制,满足不同场景需求。
  • 高质量视频生成:在保持视频真实感的同时,确保生成视频的几何一致性,避免失真。
  • 多视角一致性:模型能从不同视角生成一致的视频内容,适用多人交互场景。
  • 大规模数据支持:基于VerseControl4D数据集训练,涵盖动态和静态场景,提升模型的泛化能力。

VerseCrafter的技术原理

  • 冻结的Wan2.1主干网络:模型采用预训练的Wan2.1作为基础模型,保持强大的视频生成能力和泛化能力,同时在Wan2.1基础上注入几何控制信号。
  • GeoAdapter:一个轻量级的几何适配器,将4D控制信号(相机轨迹和3D高斯轨迹)编码为多通道地图,注入到Wan2.1的扩散块中,实现精确控制。
  • 4D控制信号渲染:将相机轨迹和目标轨迹渲染为背景RGB/深度图和3D高斯轨迹图,作为条件信号输入到生成模型中。
  • VerseControl4D数据集:通过大规模真实世界视频数据,提取相机轨迹和目标轨迹,为模型训练提供丰富的几何监督,支持动态和静态场景的生成。

VerseCrafter的项目地址

  • 项目官网:https://sixiaozheng.github.io/VerseCrafter_page/
  • GitHub仓库:https://github.com/TencentARC/VerseCrafter
  • HuggingFace模型库:https://huggingface.co/TencentARC/VerseCrafter
  • arXiv技术论文:https://arxiv.org/pdf/2601.05138

VerseCrafter的应用场景

  • 虚拟现实(VR)和增强现实(AR):VerseCrafter 可构建沉浸式虚拟世界,支持用户通过相机和物体运动控制实时探索场景,提升交互体验。
  • 游戏开发:为游戏生成动态背景和物体运动,优化视角切换和渲染效果,降低开发成本。
  • 视频内容创作:创作者用 VerseCrafter 快速生成高质量动态视频,满足广告、电影和动画制作中的创意需求。
  • 教育与培训:VerseCrafter 能创建逼真的虚拟教学场景,如历史重现和科学实验模拟,提升学生的学习兴趣和参与度。
  • 娱乐与媒体:用于开发互动式视频内容,如选择式剧情视频,观众可通过控制视角和物体运动改变故事走向。

📝 站长洞察 (Editor’s Insight)

VerseCrafter的发布,标志着视频生成技术从‘内容创造’向‘世界模拟’的关键一步。其核心价值在于将复杂的4D几何控制信号轻量化注入现有生成框架(Wan2.1),这体现了‘小模块、大能力’的工程哲学,极具行业启发性。结合VerseControl4D数据集,模型展现了强大的泛化与控制力,这直接回应了当前多模态大模型在具身智能、世界模型构建上的核心需求。从趋势看,它不仅是工具升级,更是范式预演:未来的内容创作、虚拟交互乃至自动驾驶仿真,都将依赖于此类能精确理解并操纵物理世界动态的生成模型。开源生态的建立(GitHub、HuggingFace)将加速这一进程,推动学术界与产业界在‘可控生成’这一前沿阵地的深度融合。

Fixblurry.photos AI照片修复
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
ChatMind AI思维导图
Auto GPT
Xiaomi MiMo – 小米开源的首个推理大模型
TAGGED:4D几何控制VerseCrafter复旦大学腾讯视频生成
分享
Email 复制链接 打印
Share
上一篇 英伟达开源PersonaPlex全双工语音AI模型:同时听和说,角色可定制,重新定义人机交互
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

英伟达开源PersonaPlex全双工语音AI模型:同时听和说,角色可定制,重新定义人机交互
AI 工具 AIGC 资讯
智谱开源GLM-4.7-Flash:300亿参数免费调用,编程中文写作翻译全面超越同类模型
AI 工具 AIGC 资讯
COTA:超参数科技发布全球首款「白盒」游戏AI智能体,LLM驱动实现百毫秒响应与真人级战术决策
AI 工具 AIGC 资讯
深度解析马斯克开源x-Algorithm:X平台推荐算法如何用AI大模型颠覆信息流?
AI 工具

相关推荐

AI 工具AIGC 资讯

OpenAI发布GPT-5.3 Instant:免费轻量级模型,告别说教,幻觉率大降27%

站外新闻
AI对话 GPT-5.3 Instant openai 幻觉率
AIGC 资讯

WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集

站外新闻
AIGC 资讯

Crack Coder – AI技术面试工具,提供实时编程问题支持

站外新闻
AI 工具

Picture it

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw OpenRouter prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小米 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.