Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架
AIGC 资讯

VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

站外新闻
最近更新: 2026年6月8日 下午3:00
SHARE

VideoPainter是什么

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基于双分支架构,结合轻量级上下文编码器和预训练的扩散模型,实现高效的背景保留和前景生成。框架支持插件式操作,用户根据需求灵活调整修复效果。VideoPainter 引入 ID 重采样技术,能在长视频中保持对象一致性。VideoPainter构建了 VPData 和 VPBench,目前最大的视频修复数据集,包含超过 39 万段视频剪辑,为大规模训练和评估提供支持。VideoPainter 在视频质量、掩码区域保留和文本对齐等多个指标上展现卓越了性能,为视频修复和编辑领域带来新的突破。

阅读目录
  • VideoPainter是什么
  • VideoPainter的主要功能
  • VideoPainter的技术原理
  • VideoPainter的项目地址
  • VideoPainter的应用场景

VideoPainter

VideoPainter的主要功能

  • 任意长度的视频修复:处理从短片段到长视频的各种内容,修复被遮挡或损坏的部分。
  • 背景保留与前景生成:基于双分支架构,实现背景的精确保留和前景的高质量生成。
  • 文本指导的视频编辑:支持用文本指令进行视频编辑,如添加、删除、替换或修改视频中的对象。
  • 对象一致性维持:在长视频中保持对象的身份一致性,避免出现对象漂移或突变。
  • 插件式控制:支持与不同的扩散模型或LoRA(低秩适配)模型结合,实现多样化的视频生成和编辑需求。

VideoPainter的技术原理

  • 双分支架构:
    • 背景分支:基于轻量级上下文编码器提取背景特征,注入到预训练的扩散模型中,确保背景的连贯性。
    • 前景分支:基于扩散模型的生成能力,根据文本提示生成前景内容,与背景特征结合,实现高质量的修复。
  • 轻量级上下文编码器:仅包含两层,占用主模型参数的6%,提取背景特征并以分组方式注入到扩散模型中。基于选择性特征融合,将背景特征注入到模型中,避免前景和背景信息混淆。
  • ID重采样技术:在训练时,增强目标区域的ID信息,提升模型对修复区域的感知能力。在推理时,将前一视频片段的修复区域特征与当前片段结合,确保长视频中对象的一致性。
  • 插件式控制:支持与不同的扩散模型或LoRA模型结合,用户根据需求选择合适的模型进行视频修复或编辑。兼容文本到视频(T2V)和图像到视频(I2V)扩散模型,进一步扩展应用范围。
  • 大规模数据集构建:用先进的视觉模型(如SAM2、Grounding DINO等),自动生成精确的分割掩码和密集的文本描述。构建VPData和VPBench,包含超过39万段视频剪辑,为大规模训练和评估提供支持。

VideoPainter的项目地址

  • 项目官网:https://yxbian23.github.io/project/video-painter/
  • GitHub仓库:https://github.com/TencentARC/VideoPainter
  • HuggingFace模型库:https://huggingface.co/TencentARC/VideoPainter
  • arXiv技术论文:https://arxiv.org/pdf/2503.05639

VideoPainter的应用场景

  • 影视修复与制作:修复老电影、电视剧中的损坏画面,或添加特效、修改场景。
  • 广告与营销:快速生成高质量视频内容,添加或替换背景、道具,实现个性化定制。
  • 视频创作与直播:实时修复视频中的错误或干扰,添加虚拟道具,提升视觉效果。
  • VR与AR应用:生成沉浸式视频内容,修复或修改虚拟场景,增强现实感。
  • 教育与培训:制作教学视频,修复古籍影像,添加虚拟设备或标注,增强教学效果。
国家发改委力挺!’蚂蚁阿福’用户破亿,AI+医疗普惠方案引爆行业
MiniMax Speech 2.6语音模型发布:超低延时+40+语种,Fluent LoRA技术引领AIGC新范式
MAETok – 港大联合北大等机构推出的自动编码器
EasyControl – Tiamat AI 联合上海科大等开源的图像生成控制框架
gpt-4o-transcribe – OpenAI 推出的语音转文本模型
分享
Email 复制链接 打印
Share
上一篇 Granite 4.0 Tiny Preview – IBM推出的语言模型
下一篇 Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

普林斯顿×复旦重磅开源:HistAgent,全球首个AI历史研究助手,29种语言+多模态碾压通用大模型
AI 工具 AIGC 资讯
字节跳动发布SeedVR2:单步视频修复模型,以极低成本实现1080p高清画质革新
AI 工具 AIGC 资讯
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
AI 工具 AIGC 资讯
美团LLIA框架深度解析:实时音频驱动肖像视频生成,如何实现低延迟高保真交互?
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

RedInk:开源免费AI小红书图文生成工具,一键生成爆款内容,提升创作效率

站外新闻
AIGC内容创作 AI小红书生成工具 RedInk工具 小红书运营 开源图文生成
量子芯片科技感占位特色图
AI 工具AIGC 资讯最新趋势

谷歌CEO皮查伊罕见坦承:编程领域暂落后于竞品,AI搜索将稳健转型而非激进颠覆

站外新闻
AGI AI搜索 Gemini 皮查伊 谷歌
AI 工具AIGC 资讯

Grok Build 0.2.7 重磅发布:子代理共享终端效率翻倍,图像理解飞跃,开发者必看更新

站外新闻
AI编码代理 Grok Build xAI 多模态 子代理协作
AIGC 资讯

WebWalker – 阿里推出用于评估LLMs在网页浏览任务中性能的基准工具

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.