Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
AIGC 资讯

TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术

站外新闻
最近更新: 2026年6月8日 下午2:30
SHARE

TrajectoryCrafter是什么

TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后期自由调整视频的相机位置和角度,轻松改变视频中的运镜方式。TrajectoryCrafter基于解耦视图变换和内容生成,用双流条件视频扩散模型,将点云渲染和源视频作为条件,实现对用户指定相机轨迹的精确控制和高质量的 4D 内容生成。TrajectoryCrafte用创新的双重重投影策略和混合数据集(结合动态单目视频与静态多视角数据)训练模型,显著提升在多样化场景中的泛化能力。TrajectoryCrafter 在多视角和大规模单目视频数据集上表现出色,能生成高保真、与源视频一致的新型轨迹视频,为沉浸式视频体验提供新的可能性。

阅读目录
  • TrajectoryCrafter是什么
  • TrajectoryCrafter的主要功能
  • TrajectoryCrafter的技术原理
  • TrajectoryCrafter的项目地址
  • TrajectoryCrafter的应用场景

TrajectoryCrafter

TrajectoryCrafter的主要功能

  • 精确轨迹控制:用户指定任意相机轨迹(如平移、旋转、缩放等),生成与之匹配的视频内容。
  • 高保真视频生成:生成的视频在视觉上与原始视频保持一致,具备高质量的细节和纹理。
  • 4D一致性:生成的视频在空间上与目标轨迹一致,在时间上与原始视频保持连贯性,避免内容漂移或闪烁。
  • 多样化场景泛化:模型能适应各种场景,包括室内、室外、动态场景等,具有良好的泛化能力。

TrajectoryCrafter的技术原理

  • 双流条件视频扩散模型:
    • 解耦视图变换与内容生成:将相机轨迹的确定性变换与内容生成的随机性分开处理。基于点云渲染实现精确的视图变换,用视频扩散模型生成高质量的内容。
    • 双流条件机制:模型包含两个条件输入:点云渲染(用在精确控制视图变换)和源视频(用在提供细节和纹理)。用独特的Ref-DiT模块(参考条件扩散变换器),将源视频的细节信息通过交叉注意力机制注入到生成过程中,提升生成视频的保真度。
  • 动态点云渲染:深度估计将单目视频转换为动态点云,根据用户指定的相机轨迹渲染新视图。点云渲染准确捕捉几何关系和视图变换,提供几何指导。
  • 混合数据集与训练策略:用混合数据集策略,结合网络规模的单目视频和静态多视角数据集进行训练。对于单目视频,用双重重投影策略生成大规模的训练样本。具体方法是将视频通过深度估计提升为点云,渲染新视图后再重新投影回原始视角,模拟点云渲染的效果。模型用两阶段训练策略,第一阶段专注于视图变换的准确性和缺失区域的合成;第二阶段用多视角数据集训练,提升生成视频与源视频的一致性。

TrajectoryCrafter的项目地址

  • 项目官网:https://trajectorycrafter.github.io/
  • GitHub仓库:https://github.com/TrajectoryCrafter/TrajectoryCrafter
  • arXiv技术论文:https://arxiv.org/pdf/2503.05638
  • 在线体验Demo:https://huggingface.co/spaces/Doubiiu/TrajectoryCrafter

TrajectoryCrafter的应用场景

  • 沉浸式娱乐:用在VR/AR,让用户自由切换视角,增强沉浸感。
  • 创意视频制作:帮助影视、短视频创作者添加新视角效果,提升内容吸引力。
  • 智能视频会议:动态调整会议视角,聚焦特定区域或人员,提升交互性。
  • 自动驾驶与机器人:生成多视角驾驶或导航场景,用在训练和测试算法。
  • 教育与培训:创建多视角教学视频,帮助学生更好地理解和学习。
Piece it Together – Bria AI等机构推出的图像生成框架
腾讯混元×浙大重磅开源OmniWeaving:统一六大视频生成任务,MLLM思考模式让AI化身‘智能导演’
Kimi Latest – Kimi推出的实时更新AI模型,与Kimi智能助手同步
Heygem – 硅基智能推出的开源数字人模型
html-video – Open Design 团队开源的 HTML 版剪映
分享
Email 复制链接 打印
Share
上一篇 Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型
下一篇 Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

GR00T N1 – 英伟达开源的人形机器人基础模型

站外新闻
AIGC 资讯

GitFriend – AI GitHub助手,自动生成定制化README文件

站外新闻
AI 工具AIGC 资讯

字节豆包1.6 Lite发布:性能飙升14%成本骤降53%,轻量级AI模型如何重塑企业智能应用?

站外新闻
AIGC 企业级应用 字节跳动 豆包大模型 轻量级AI模型
AI 工具AIGC 资讯

英伟达Nemotron 3开源模型系列发布:MoE架构助力4倍吞吐量,重塑多智能体AI开发范式

站外新闻
MoE Nemotron 3 多智能体AI 混合专家模型 英伟达
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.