Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: PartEdit – KAUST推出的细粒度图像编辑方法
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > PartEdit – KAUST推出的细粒度图像编辑方法
AIGC 资讯

PartEdit – KAUST推出的细粒度图像编辑方法

站外新闻
最近更新: 2026年6月8日 下午3:49
SHARE

PartEdit是什么

PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记(称为“部分标记”),让扩散模型精准定位和编辑图像中对象的各个部分。这些部分标记学习与对象部分对应的非二进制掩码,在每个扩散步骤中实现对编辑区域的定位,结合特征混合与自适应阈值策略,无缝集成编辑内容,且保留未编辑区域。PartEdit无需重新训练模型,能实现高质量的编辑效果。PartEdit支持真实图像编辑和多部分同时编辑,为创作者提供强大的工具实现精准且富有创意的图像修改。

阅读目录
  • PartEdit是什么
  • PartEdit的主要功能
  • PartEdit的技术原理
  • PartEdit的项目地址
  • PartEdit的应用场景

PartEdit

PartEdit的主要功能

  • 精准定位与编辑对象部分:对图像中对象的各个部分(如头部、车身、引擎盖等)进行精准定位和编辑,实现用户指定的细粒度修改。
  • 无缝集成编辑内容:基于优化的非二进制掩码和自适应阈值策略,将编辑内容与原始图像无缝融合,避免编辑区域的突兀过渡。
  • 高质量视觉效果:生成的编辑图像具有高视觉质量,保留未编辑区域的原始细节,确保编辑部分与整体图像风格一致。
  • 支持多种编辑类型:实现语义编辑(如更换对象部分)和风格调整(如改变颜色、材质等),并能够生成传统方法难以实现的复杂概念。
  • 真实图像编辑:结合图像反转技术,对真实照片进行编辑,不仅限于合成图像。
  • 多部分同时编辑:支持在推理时同时编辑多个部分,无需重新训练模型,提高编辑效率。

PartEdit的技术原理

  • 预训练扩散模型:基于预训练的扩散模型(如SDXL)的强大生成能力,逆向扩散过程生成图像。扩散模型基于逐步去除噪声生成图像,用文本提示引导生成过程。
  • 部分标记(Part Tokens):优化特定的文本标记扩展模型对对象部分的理解。这些标记在扩散过程的每个步骤中生成可靠的非二进制掩码,用在定位编辑区域。
  • 优化过程:用二元交叉熵(BCE)损失函数,结合少量标注数据(如PASCAL-Part或PartImageNet),优化部分标记,在不同UNet块和时间步中生成与对象部分对应的注意力图。
  • 特征混合与自适应阈值策略:在扩散过程的每个时间步和UNet层,基于非二进制掩码将源图像特征与编辑图像特征进行混合。自适应阈值策略用于平滑编辑区域与未编辑区域的过渡,确保编辑的自然性。
  • 时间步选择:分析不同时间步的图像生成状态,选择中间时间步来优化大型部分的定位,对小型部分结合中间和后期时间步,实现最佳定位效果。
  • 真实图像反转:对于真实图像编辑,结合图像反转技术(如Ledits++或EF-DDPM)估计真实图像的扩散轨迹,作为源路径进行编辑。

PartEdit的项目地址

  • 项目官网:https://partedit.github.io/PartEdit/
  • arXiv技术论文:https://arxiv.org/pdf/2502.04050

PartEdit的应用场景

  • 艺术创作与设计:帮助艺术家和设计师快速实现创意构思。
  • 影视与游戏制作:在影视和游戏的视觉效果制作中,快速修改角色外观或场景元素。
  • 广告设计:广告设计师快速生成产品广告的多种视觉效果。
  • 虚拟现实(VR)和增强现实(AR):在VR和AR应用中,实时修改虚拟环境中的对象。
  • 教育行业:在教育领域,创建教学材料,帮助学生更好地理解复杂的概念。
科技格局重塑:MiniMax企业客户破百万领跑AI商业化,创想三维港股上市引爆消费级3D打印市场
OpenUtau – 开源的AI歌声合成工具,自动适配系统语言
AutoRAG – Cloudflare 推出的全托管检索增强生成服务
百川智能Baichuan-M4医疗大模型登顶全球榜单:幻觉率仅3.3%,AI家庭医生”百小医”开启健康管理新范式
SuperEdit – 字节跳动等机构推出的图像编辑方法
分享
Email 复制链接 打印
Share
上一篇 Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型
下一篇 ART – 微软联合清华和北大等推出的多层透明图像生成技术
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

ART – 微软联合清华和北大等推出的多层透明图像生成技术
AIGC 资讯
Seedream 2.0 – 字节豆包推出的原生中英双语图像生成模型
AIGC 资讯
GR00T N1 – 英伟达开源的人形机器人基础模型
AIGC 资讯
Firefly Image Model 4 – Adobe 推出的图像生成模型
AIGC 资讯

相关推荐

AIGC 资讯

FreeLLMAPI – 开源 AI 模型聚合平台,统一OpenAI兼容格式

站外新闻
AIGC 资讯

Midjourney 不同画面艺术流派风格 Prompts 对人像生成效果的影响

OZ
AI人像 AI生成 AI绘画 Midjourney prompt 人像
量子芯片科技感占位特色图
AI 工具AIGC 资讯

OpenAI 紧急修复 ChatGPT 与 API 高延迟故障:服务已恢复,部分功能仍待优化

站外新闻
AI基础设施 API服务 chatgpt openai 高延迟
量子芯片科技感占位特色图
AI 工具AIGC 资讯

AI颠覆开店选址!高德×钉钉悟空发布智能助手,告别‘蹲点’时代

站外新闻
AI选址 商业决策 钉钉悟空 高德
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.