Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架
AIGC 资讯

VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

站外新闻
最近更新: 2026年6月8日 下午3:00
SHARE

VideoPainter是什么

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基于双分支架构,结合轻量级上下文编码器和预训练的扩散模型,实现高效的背景保留和前景生成。框架支持插件式操作,用户根据需求灵活调整修复效果。VideoPainter 引入 ID 重采样技术,能在长视频中保持对象一致性。VideoPainter构建了 VPData 和 VPBench,目前最大的视频修复数据集,包含超过 39 万段视频剪辑,为大规模训练和评估提供支持。VideoPainter 在视频质量、掩码区域保留和文本对齐等多个指标上展现卓越了性能,为视频修复和编辑领域带来新的突破。

阅读目录
  • VideoPainter是什么
  • VideoPainter的主要功能
  • VideoPainter的技术原理
  • VideoPainter的项目地址
  • VideoPainter的应用场景

VideoPainter

VideoPainter的主要功能

  • 任意长度的视频修复:处理从短片段到长视频的各种内容,修复被遮挡或损坏的部分。
  • 背景保留与前景生成:基于双分支架构,实现背景的精确保留和前景的高质量生成。
  • 文本指导的视频编辑:支持用文本指令进行视频编辑,如添加、删除、替换或修改视频中的对象。
  • 对象一致性维持:在长视频中保持对象的身份一致性,避免出现对象漂移或突变。
  • 插件式控制:支持与不同的扩散模型或LoRA(低秩适配)模型结合,实现多样化的视频生成和编辑需求。

VideoPainter的技术原理

  • 双分支架构:
    • 背景分支:基于轻量级上下文编码器提取背景特征,注入到预训练的扩散模型中,确保背景的连贯性。
    • 前景分支:基于扩散模型的生成能力,根据文本提示生成前景内容,与背景特征结合,实现高质量的修复。
  • 轻量级上下文编码器:仅包含两层,占用主模型参数的6%,提取背景特征并以分组方式注入到扩散模型中。基于选择性特征融合,将背景特征注入到模型中,避免前景和背景信息混淆。
  • ID重采样技术:在训练时,增强目标区域的ID信息,提升模型对修复区域的感知能力。在推理时,将前一视频片段的修复区域特征与当前片段结合,确保长视频中对象的一致性。
  • 插件式控制:支持与不同的扩散模型或LoRA模型结合,用户根据需求选择合适的模型进行视频修复或编辑。兼容文本到视频(T2V)和图像到视频(I2V)扩散模型,进一步扩展应用范围。
  • 大规模数据集构建:用先进的视觉模型(如SAM2、Grounding DINO等),自动生成精确的分割掩码和密集的文本描述。构建VPData和VPBench,包含超过39万段视频剪辑,为大规模训练和评估提供支持。

VideoPainter的项目地址

  • 项目官网:https://yxbian23.github.io/project/video-painter/
  • GitHub仓库:https://github.com/TencentARC/VideoPainter
  • HuggingFace模型库:https://huggingface.co/TencentARC/VideoPainter
  • arXiv技术论文:https://arxiv.org/pdf/2503.05639

VideoPainter的应用场景

  • 影视修复与制作:修复老电影、电视剧中的损坏画面,或添加特效、修改场景。
  • 广告与营销:快速生成高质量视频内容,添加或替换背景、道具,实现个性化定制。
  • 视频创作与直播:实时修复视频中的错误或干扰,添加虚拟道具,提升视觉效果。
  • VR与AR应用:生成沉浸式视频内容,修复或修改虚拟场景,增强现实感。
  • 教育与培训:制作教学视频,修复古籍影像,添加虚拟设备或标注,增强教学效果。
Gemini 3.5 生产环境严重失控:越权删光两万行代码并编造修复报告,AI 开发信任危机再升级
TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术
AgentPrune – 同济联合港中文等机构推出的多智能体通信优化框架
TrendPublish – AI内容发布工具,支持智能总结和自动发布
GPT-4.5 – OpenAI 推出的最强聊天模型
分享
Email 复制链接 打印
Share
上一篇 Granite 4.0 Tiny Preview – IBM推出的语言模型
下一篇 Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型
AIGC 资讯
Granite 4.0 Tiny Preview – IBM推出的语言模型
AIGC 资讯
Video-T1 – 清华联合腾讯推出的视频生成技术
AIGC 资讯
Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术
AIGC 资讯

相关推荐

AIGC 资讯

ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

站外新闻
AI 工具AIGC 资讯

网易有道Confucius4开源发布:27B参数多模态数学推理模型,多项基准SOTA,推理链长度降43% | 免费商用

站外新闻
Confucius4 Qwen3.5-27B 多模态大模型 数学推理 网易有道
AIGC 资讯

Umi-OCR – 免费 OCR 文字识别工具,支持截图、批量图片排版解析

站外新闻
AI 工具AIGC 资讯

美团万亿参数大模型LongCat-2.0-Preview:国产芯片训推闭环破局,1M上下文免费开放内测

站外新闻
MoE架构 万亿参数 国产算力 大模型 美团
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.