Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DiffuEraser – 阿里通义实验室推出的视频修复模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DiffuEraser – 阿里通义实验室推出的视频修复模型
AIGC 资讯

DiffuEraser – 阿里通义实验室推出的视频修复模型

站外新闻
最近更新: 2026年6月9日 上午3:19
SHARE

DiffuEraser是什么

DiffuEraser是基于稳定扩散模型的视频修复模型,以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结合先验信息来提供初始化和弱条件,有助于减少噪声伪影和抑制幻觉。为了在长序列推理期间提高时间一致性,DiffuEraser 扩展了先验模型和自身的时间感受野,进一步基于视频扩散模型的时间平滑特性来增强一致性。 DiffuEraser 的网络架构受 AnimateDiff 的启发,将运动模块集成到图像修复模型中。主要由主去噪 UNet 和辅助的 BrushNet 组成。BrushNet 分支接收由遮罩图像、遮罩和噪声潜变量组成的条件潜变量输入。BrushNet 提取的特征在经过零卷积块后逐层整合到去噪 UNet 中。去噪 UNet 处理噪声潜变量。为了增强时间一致性,模型在自注意力和交叉注意力层之后引入了时间注意力机制。去噪后,生成的图像使用模糊遮罩与输入的遮罩图像进行融合。

阅读目录
  • DiffuEraser是什么
  • DiffuEraser的主要功能
  • DiffuEraser的技术原理
  • DiffuEraser的项目地址
  • DiffuEraser的应用场景

DiffuEraser

DiffuEraser的主要功能

  • 未知像素的生成:基于稳定扩散模型的强大生成能力,DiffuEraser能为视频中从未出现过的像素生成合理且具有丰富细节和纹理的内容,有效解决了传统Transformer模型在处理大遮罩时常见的模糊和马赛克问题。
  • 已知像素的传播:DiffuEraser通过运动模块和先验模型的增强传播能力,确保已知像素(在某些遮罩帧中出现过的像素)能在不同帧之间充分且一致地传播。防止修复内容与未遮罩区域之间的冲突,提高结果的正确性和稳定性。
  • 时间一致性维护:在长序列推理期间,DiffuEraser通过扩展先验模型和自身的时间感受野,基于视频扩散模型的时间平滑特性,增强了所有帧之间完成内容的时间一致性。
  • 先验信息的注入:DiffuEraser通过注入先验信息来提供初始化和弱条件,有助于减少噪声伪影,抑制扩散模型常见的视觉幻觉,生成更准确、更真实的修复结果。
  • 网络架构优化:DiffuEraser的网络架构受到AnimateDiff的启发,将运动模块集成到图像修复模型BrushNet中,通过在自注意力和交叉注意力层之后引入时间注意力机制,进一步增强了时间一致性。

DiffuEraser的技术原理

  • 网络架构:DiffuEraser的网络架构受到AnimateDiff的启发,将运动模块集成到图像修复模型BrushNet中。架构主要由主去噪UNet和辅助的BrushNet组成。BrushNet分支接收由遮罩图像、遮罩和噪声潜变量组成的条件潜变量输入,提取的特征在经过零卷积块后逐层整合到去噪UNet中。去噪UNet负责处理噪声潜变量。为了增强时间一致性,模型在自注意力和交叉注意力层之后引入了时间注意力机制。去噪后,生成的图像使用模糊遮罩与输入的遮罩图像进行融合。
  • 视频修复问题的分解:DiffuEraser将视频修复问题分解为三个子问题:已知像素的传播、未知像素的生成以及完成内容的时间一致性维护。
  • 时间一致性优化:为了在长序列推理期间提高时间一致性,DiffuEraser采取了以下策略:
    • 扩展先验模型的时间感受野:通过预传播和预推理,先验模型能跨越整个时间域传播已知像素,确保完成内容与未遮罩区域的一致性,稳定结果。
    • 扩展DiffuEraser的时间感受野:通过预推理,DiffuEraser能够处理更广泛的视频帧,确保在长序列推理中生成内容的一致性。

DiffuEraser的项目地址

  • 项目官网:https://lixiaowen-xw.github.io/DiffuEraser-page/
  • GitHub仓库:https://github.com/lixiaowen-xw/DiffuEraser
  • arXiv技术论文:https://arxiv.org/pdf/2501.10018

DiffuEraser的应用场景

  • 电影和电视剧后期制作:在电影或电视剧的后期制作中,DiffuEraser可以用于修复视频中的遮罩区域,提升视频质量,进行去模糊和超分辨率处理,适应不同分辨率的播放需求。
  • 老电影修复:对于老旧影片的数字化修复,DiffuEraser能去除胶片的划痕、灰尘和其他退化,提升分辨率,让老电影焕发新生。
  • 监控视频增强:在安全监控领域,DiffuEraser可以增强监控视频的清晰度,帮助识别细节,提高监控效率。
  • 视频内容转换:内容创作者可以用DiffuEraser将标准清晰度(SD)的视频内容转换为高清(HD)或4K,满足现代显示设备的需求。
  • 体育赛事直播:在体育赛事直播中,DiffuEraser可以用于实时视频流的增强,提供更清晰的观看体验。
百度文心5.0 Preview发布:LMArena排名全球第二,国产大模型再迎突破
GPT‑5.4发布:OpenAI旗舰AI首次超越人类,原生操作电脑、深度工作、百万Token上下文一统
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力
MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
UniToken – 复旦联合美团等机构推出的统一视觉编码框架
分享
Email 复制链接 打印
Share
上一篇 GameFactory – 香港大学和快手联合推出的可泛化游戏场景框架
下一篇 星火医疗大模型X1 – 讯飞医疗推出的深度推理大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

普林斯顿×复旦重磅开源:HistAgent,全球首个AI历史研究助手,29种语言+多模态碾压通用大模型
AI 工具 AIGC 资讯
字节跳动发布SeedVR2:单步视频修复模型,以极低成本实现1080p高清画质革新
AI 工具 AIGC 资讯
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
AI 工具 AIGC 资讯
美团LLIA框架深度解析:实时音频驱动肖像视频生成,如何实现低延迟高保真交互?
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

LAM – 微软推出的大型行动模型,能自主操作Windows程序

站外新闻
AIGC 资讯

OmniSQL – 开源文本到 SQL 模型,自然语言转换为 SQL 查询语句

站外新闻
AI 工具AIGC 资讯

GPT‑5.4发布:75%成功率超越人类,首款能独立操作电脑的AI模型来了

站外新闻
AI Agent GPT-5.4 openai 计算机操作
AI 工具AIGC 资讯

智谱华为联合开源GLM-Image:国产芯片训练的SOTA多模态图像生成模型,攻克文字渲染难题

站外新闻
GLM-Image MindSpore 多模态图像生成 文字渲染 昇腾芯片
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.