Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
AIGC 资讯

TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术

站外新闻
最近更新: 2026年6月8日 下午2:30
SHARE

TrajectoryCrafter是什么

TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后期自由调整视频的相机位置和角度,轻松改变视频中的运镜方式。TrajectoryCrafter基于解耦视图变换和内容生成,用双流条件视频扩散模型,将点云渲染和源视频作为条件,实现对用户指定相机轨迹的精确控制和高质量的 4D 内容生成。TrajectoryCrafte用创新的双重重投影策略和混合数据集(结合动态单目视频与静态多视角数据)训练模型,显著提升在多样化场景中的泛化能力。TrajectoryCrafter 在多视角和大规模单目视频数据集上表现出色,能生成高保真、与源视频一致的新型轨迹视频,为沉浸式视频体验提供新的可能性。

阅读目录
  • TrajectoryCrafter是什么
  • TrajectoryCrafter的主要功能
  • TrajectoryCrafter的技术原理
  • TrajectoryCrafter的项目地址
  • TrajectoryCrafter的应用场景

TrajectoryCrafter

TrajectoryCrafter的主要功能

  • 精确轨迹控制:用户指定任意相机轨迹(如平移、旋转、缩放等),生成与之匹配的视频内容。
  • 高保真视频生成:生成的视频在视觉上与原始视频保持一致,具备高质量的细节和纹理。
  • 4D一致性:生成的视频在空间上与目标轨迹一致,在时间上与原始视频保持连贯性,避免内容漂移或闪烁。
  • 多样化场景泛化:模型能适应各种场景,包括室内、室外、动态场景等,具有良好的泛化能力。

TrajectoryCrafter的技术原理

  • 双流条件视频扩散模型:
    • 解耦视图变换与内容生成:将相机轨迹的确定性变换与内容生成的随机性分开处理。基于点云渲染实现精确的视图变换,用视频扩散模型生成高质量的内容。
    • 双流条件机制:模型包含两个条件输入:点云渲染(用在精确控制视图变换)和源视频(用在提供细节和纹理)。用独特的Ref-DiT模块(参考条件扩散变换器),将源视频的细节信息通过交叉注意力机制注入到生成过程中,提升生成视频的保真度。
  • 动态点云渲染:深度估计将单目视频转换为动态点云,根据用户指定的相机轨迹渲染新视图。点云渲染准确捕捉几何关系和视图变换,提供几何指导。
  • 混合数据集与训练策略:用混合数据集策略,结合网络规模的单目视频和静态多视角数据集进行训练。对于单目视频,用双重重投影策略生成大规模的训练样本。具体方法是将视频通过深度估计提升为点云,渲染新视图后再重新投影回原始视角,模拟点云渲染的效果。模型用两阶段训练策略,第一阶段专注于视图变换的准确性和缺失区域的合成;第二阶段用多视角数据集训练,提升生成视频与源视频的一致性。

TrajectoryCrafter的项目地址

  • 项目官网:https://trajectorycrafter.github.io/
  • GitHub仓库:https://github.com/TrajectoryCrafter/TrajectoryCrafter
  • arXiv技术论文:https://arxiv.org/pdf/2503.05638
  • 在线体验Demo:https://huggingface.co/spaces/Doubiiu/TrajectoryCrafter

TrajectoryCrafter的应用场景

  • 沉浸式娱乐:用在VR/AR,让用户自由切换视角,增强沉浸感。
  • 创意视频制作:帮助影视、短视频创作者添加新视角效果,提升内容吸引力。
  • 智能视频会议:动态调整会议视角,聚焦特定区域或人员,提升交互性。
  • 自动驾驶与机器人:生成多视角驾驶或导航场景,用在训练和测试算法。
  • 教育与培训:创建多视角教学视频,帮助学生更好地理解和学习。
Eagle 2.5 – 英伟达推出的视觉语言模型
Ideogram 3.0 – Ideogram推出的 AI 图像生成模型
子曰翻译2.0 – 网易有道推出的最新翻译大模型
AingDesk – 开源AI客户端工具,一键部署上百款 AI 模型到个人电脑
RF-DETR – Roboflow推出的实时目标检测模型
分享
Email 复制链接 打印
Share
上一篇 Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型
下一篇 Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
AIGC 资讯
Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型
AIGC 资讯
Fin-R1 – 上海财经联合财跃星辰推出的金融推理大模型
AIGC 资讯
DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型
AIGC 资讯

相关推荐

量子芯片科技感占位特色图
AI 工具AIGC 资讯

颠覆性突破!全球首个多智能体AI科学家Robin 2小时完成900小时科研,登顶Nature

站外新闻
FutureHouse Robin AI科学家 多智能体AI系统 干性年龄相关黄斑变性 药物研发自动化
AI 工具AIGC 资讯

OpenAI发布GPT-5.5:编程、科研、办公全面超越,AI智能体时代加速到来

站外新闻
AI编程 GPT-5.5 openai 大模型 英伟达
AIGC 资讯

AvatarFX – Character.AI 推出的 AI 视频生成模型

站外新闻
AI 工具AIGC 资讯

9Router深度评测:开源AI编程路由神器,智能调度100+模型,Token成本直降40% | 开发者必备工具

站外新闻
AI编程工具 Claude Code Token优化 开源代理 智能路由
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.