Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DCEdit – 北交大联合美图推出的双层控制图像编辑方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DCEdit – 北交大联合美图推出的双层控制图像编辑方法
AIGC 资讯

DCEdit – 北交大联合美图推出的双层控制图像编辑方法

站外新闻
最近更新: 2026年6月8日 下午3:21
SHARE

DCEdit是什么

DCEdit 是新型的双层控制图像编辑方法,是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略(PSL),用视觉和文本自注意力优化交叉注意力图,提供更精准的区域线索指导图像编辑。DCEdit 引入双层控制机制(DLC),在特征层和隐空间层同时融入区域线索,实现更精细的编辑控制。DCEdit 无需额外训练或微调,应用在现有的基于扩散变换器(DiT)的编辑方法,在背景保留和编辑准确性方面表现出色。

阅读目录
  • DCEdit是什么
  • DCEdit的主要功能
  • DCEdit的技术原理
  • DCEdit的项目地址
  • DCEdit的应用场景

DCEdit

DCEdit的主要功能

  • 精确语义定位:精确定位图像中需要编辑的语义区域,同时保留背景和其他未编辑区域的细节。
  • 双层控制机制:在特征层和隐空间层同时融入区域线索,实现对编辑过程的细粒度控制,提升编辑效果。
  • 支持复杂图像编辑:适用于高分辨率、复杂背景的真实世界图像,支持处理多种编辑任务,如改变颜色、替换对象、添加或删除对象等。

DCEdit的技术原理

  • 精确语义定位策略(PSL):结合视觉自注意力和文本自注意力,优化交叉注意力图。视觉自注意力矩阵捕捉图像内部的亲和关系,文本自注意力矩阵用于解耦语义之间的纠缠。基于视觉自注意力矩阵的重加权和文本自注意力矩阵的逆操作,优化交叉注意力图,更准确地反映目标语义区域。优化后的交叉注意力图作为区域线索,指导编辑过程,确保编辑效果集中在目标区域。
  • 双层控制机制(DLC):在特征层中,基于软融合机制,用优化后的交叉注意力图选择性地保留与编辑文本激活的特征,避免直接替换特征导致的编辑效果丢失。在隐空间层中,基于扩散混合方法,用二值化后的交叉注意力图保留背景信息,防止背景区域被错误编辑。反演过程将源图像映射到初始噪声,在采样过程中应用双层控制机制,生成编辑后的图像。
  • RW-800基准:包含高分辨率的真实世界图像,确保测试数据的多样性和复杂性。提供详细的文本描述,支持复杂的编辑任务。

DCEdit的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2503.16795

DCEdit的应用场景

  • 广告与营销:快速修改广告图像中的元素(如颜色、背景、标志等),提升制作效率。
  • 影视与娱乐:便捷调整影视场景中的道具、服装或背景,节省时间和成本。
  • 社交媒体与内容创作:根据主题快速修改图像,增强内容吸引力和多样性。
  • 产品设计与开发:快速生成产品不同设计方案,加速开发流程。
  • 教育与培训:创建个性化学习材料,帮助学生更好地理解教学内容。
OpenAI Codex重磅更新:Mac锁屏也能自动执行任务,开发者生产力迎来颠覆式提升
重磅!iOS 27联手谷歌Gemini训练本地AI,Siri部分请求转向谷歌云,隐私与算力如何平衡?
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息
Webwright – 微软开源的终端原生网页智能体框架
YC总裁亲测开源GBrain:打造AI Agent永生记忆,万级文件知识图谱实战解析
分享
Email 复制链接 打印
Share
上一篇 ChatGPT 升级记忆系统 全面推向用户
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

ChatGPT 升级记忆系统 全面推向用户
AIGC 资讯
NextGenAI – OpenAI 推出的教育联盟,联合15家顶尖大学和机构
AIGC 资讯
Agentic Object Detection – 吴恩达团队推出的Agent目标检测技术
AIGC 资讯
国产大模型掀起新一轮上市潮,阶跃星辰冲刺香港近年来最大AI IPO
AIGC 资讯

相关推荐

AIGC 资讯

Midjourney 不同画面艺术流派风格 Prompts 对人像生成效果的影响

OZ
AI人像 AI生成 AI绘画 Midjourney prompt 人像
AIGC 资讯

Pad.ws – 在线AI开发工具,白板功能与代码编辑器深度结合

站外新闻
AI 工具AIGC 资讯

Claude Design系统提示词深度解析:Anthropic如何用AI设计工程师规则终结’AI味’UI

站外新闻
AIGC AI设计 Anthropic Claude 系统提示词
AI 工具AIGC 资讯

NVIDIA Nemotron 3 Nano Omni:30B参数撬动多模态Agent推理,成本狂降9倍!

站外新闻
Agent MoE Nemotron NVIDIA 多模态
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.