Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式
AI 工具AIGC 资讯

VerseCrafter:复旦腾讯联手开源,4D几何控制重塑动态视频生成新范式

站外新闻
最近更新: 2026年6月7日 下午8:08
4D几何控制 VerseCrafter 复旦大学 腾讯 视频生成
SHARE

💡 站外导读:在AIGC浪潮席卷全球的今天,如何从静态图像生成跃升至对动态场景的精准控制,是视频生成领域的核心痛点。传统模型常面临视角漂移、物体运动失真等难题,难以满足虚拟现实、游戏开发等应用对高一致性动态内容的需求。VerseCrafter应运而生,作为复旦与腾讯的开源力作,它首次将4D几何控制能力融入视频世界模型,旨在彻底解决动态场景生成中的时空一致性瓶颈,为下一代沉浸式内容创作铺平道路。

VerseCrafter是什么

VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练,能处理复杂动态场景,保持强时空一致性。用户能指定相机轨迹和目标轨迹,生成高质量、几何一致的视频。模型能在视频生成、虚拟现实和游戏开发等领域具有广阔的应用前景。

阅读目录
  • VerseCrafter是什么
  • VerseCrafter的主要功能
  • VerseCrafter的技术原理
  • VerseCrafter的项目地址
  • VerseCrafter的应用场景
      • 📝 站长洞察 (Editor’s Insight)

VerseCrafter

VerseCrafter的主要功能

  • 4D几何控制:用户能通过指定相机轨迹和多目标的3D高斯轨迹,实现对视频中视角和物体运动的精确控制。
  • 灵活的控制模式:模型支持相机单独控制、目标单独控制及相机与目标的联合控制,满足不同场景需求。
  • 高质量视频生成:在保持视频真实感的同时,确保生成视频的几何一致性,避免失真。
  • 多视角一致性:模型能从不同视角生成一致的视频内容,适用多人交互场景。
  • 大规模数据支持:基于VerseControl4D数据集训练,涵盖动态和静态场景,提升模型的泛化能力。

VerseCrafter的技术原理

  • 冻结的Wan2.1主干网络:模型采用预训练的Wan2.1作为基础模型,保持强大的视频生成能力和泛化能力,同时在Wan2.1基础上注入几何控制信号。
  • GeoAdapter:一个轻量级的几何适配器,将4D控制信号(相机轨迹和3D高斯轨迹)编码为多通道地图,注入到Wan2.1的扩散块中,实现精确控制。
  • 4D控制信号渲染:将相机轨迹和目标轨迹渲染为背景RGB/深度图和3D高斯轨迹图,作为条件信号输入到生成模型中。
  • VerseControl4D数据集:通过大规模真实世界视频数据,提取相机轨迹和目标轨迹,为模型训练提供丰富的几何监督,支持动态和静态场景的生成。

VerseCrafter的项目地址

  • 项目官网:https://sixiaozheng.github.io/VerseCrafter_page/
  • GitHub仓库:https://github.com/TencentARC/VerseCrafter
  • HuggingFace模型库:https://huggingface.co/TencentARC/VerseCrafter
  • arXiv技术论文:https://arxiv.org/pdf/2601.05138

VerseCrafter的应用场景

  • 虚拟现实(VR)和增强现实(AR):VerseCrafter 可构建沉浸式虚拟世界,支持用户通过相机和物体运动控制实时探索场景,提升交互体验。
  • 游戏开发:为游戏生成动态背景和物体运动,优化视角切换和渲染效果,降低开发成本。
  • 视频内容创作:创作者用 VerseCrafter 快速生成高质量动态视频,满足广告、电影和动画制作中的创意需求。
  • 教育与培训:VerseCrafter 能创建逼真的虚拟教学场景,如历史重现和科学实验模拟,提升学生的学习兴趣和参与度。
  • 娱乐与媒体:用于开发互动式视频内容,如选择式剧情视频,观众可通过控制视角和物体运动改变故事走向。

📝 站长洞察 (Editor’s Insight)

VerseCrafter的发布,标志着视频生成技术从‘内容创造’向‘世界模拟’的关键一步。其核心价值在于将复杂的4D几何控制信号轻量化注入现有生成框架(Wan2.1),这体现了‘小模块、大能力’的工程哲学,极具行业启发性。结合VerseControl4D数据集,模型展现了强大的泛化与控制力,这直接回应了当前多模态大模型在具身智能、世界模型构建上的核心需求。从趋势看,它不仅是工具升级,更是范式预演:未来的内容创作、虚拟交互乃至自动驾驶仿真,都将依赖于此类能精确理解并操纵物理世界动态的生成模型。开源生态的建立(GitHub、HuggingFace)将加速这一进程,推动学术界与产业界在‘可控生成’这一前沿阵地的深度融合。

AIGCPanel 2.0重磅发布:工作流引擎+CLI工具,一键自动化生产数字人视频
Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术
InternVL3 – 上海 AI Lab 开源的多模态大语言模型
EdgeClaw:面壁智能联合清华开源AI智能体框架,首创三层数据安全协议,实现端云协同与本地隐私守护
MiniMax Office Skills开源!四大组件破解AI生成文档「能用不能交」世纪难题,生产级办公引擎直击金融法律交付痛点
TAGGED:4D几何控制VerseCrafter复旦大学腾讯视频生成
分享
Email 复制链接 打印
Share
上一篇 英伟达开源PersonaPlex全双工语音AI模型:同时听和说,角色可定制,重新定义人机交互
下一篇 Playwriter:开源AI浏览器自动化神器,解决登录验证难题,节省80% Token消耗
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

Claude Code 实战宝典:开源指南含86+技巧与10+工作流对比,从氛围编程到智能体工程

站外新闻
AIGC Claude Code 开发者工作流 开源工具 智能体工程
AIGC 资讯

FlashVideo – 字节联合港大推出的高分辨率视频生成框架

站外新闻
AI 工具

WPS AI

remaker
AI 工具

SeaArt

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.