ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型

最近更新: 2026年6月8日上午3:27

ObjectMover是什么

ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型，解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题。将物体移动视为两帧视频的特殊案例，利用预训练视频生成模型的跨帧一致性学习能力，通过微调模型将其迁移到图像编辑任务。模型采用序列到序列建模，输入包括原始图像、目标物体图像和指令图，输出为物体移动后的合成图像。

阅读目录

ObjectMover是什么
ObjectMover的主要功能
ObjectMover的技术原理
ObjectMover的项目地址
ObjectMover的应用场景

ObjectMover

ObjectMover的主要功能

物体移动：可将图像中的物体移动到指定位置，自动调整相关的物理效果，如光照、阴影、反射等，同时保持物体的身份特征。
物体删除：能真实地填充被移除物体的背景，非生成不相干的新物体，准确地移除与物体相关的光影。
物体插入：能精准保持被插入物体的身份特征，自动生成与环境一致的光影效果。

ObjectMover的技术原理

视频先验迁移：ObjectMover将物体移动任务视为两帧视频的特殊案例，利用预训练视频生成模型（如扩散模型）对跨帧一致性的学习能力。通过微调模型，将其从视频生成任务迁移到图像编辑任务。能充分利用视频模型预训练时习得的物理规律及物体对应关系，在图像编辑任务中实现精确的光影同步与身份特征保持。
序列到序列建模：模型将物体移动任务重构为序列预测问题。输入包括原始图像、目标物体图像、指令图（标注移动位置与方向），输出为物体移动后的合成图像。使模型能更好地理解和处理物体在不同位置下的光影变化和遮挡关系。
合成数据集构建：由于缺乏大规模物体移动的真实数据，研究团队使用现代游戏引擎（如虚幻引擎）生成高质量合成数据对。数据涵盖了复杂光照、材质和遮挡场景，增强了模型训练的多样性和泛化能力。
多任务学习策略：ObjectMover结合了物体移动、移除、插入及视频数据插入四个子任务，通过统一框架在合成数据与真实视频数据上进行训练。提升了模型对真实场景的泛化能力，使模型在处理不同图像编辑任务时表现出更高的适应性和鲁棒性。

ObjectMover的项目地址

项目官网：https://xinyu-andy.github.io/ObjMover/
arXiv技术论文：https://arxiv.org/pdf/2503.08037

ObjectMover的应用场景

特效制作：对于一些复杂的特效场景，如物体的消失或出现，ObjectMover可以实现物体的删除和插入，保持场景的真实感。
虚拟场景编辑：在虚拟现实和游戏开发中，需要对虚拟场景中的物体进行灵活的调整。ObjectMover可以用来移动场景中的物体，如将一个道具从一个位置移动到另一个位置，同时保持物体的光照和阴影与环境一致。
游戏关卡设计：开发者可以用ObjectMover快速调整关卡中的物体布局，提高关卡设计的效率。
产品展示：对于产品广告，可以用ObjectMover将产品放置在不同的场景中，展示产品的不同使用场景。
空间规划：在建筑和室内设计中，可以用ObjectMover将家具或装饰品移动到不同的位置，评估不同的设计方案。

PixelFlow – 港大联合 Adobe 推出的图像生成模型

VITA-Audio – 开源的端到端多模态语音大模型，低延迟、推理快

发表评价

ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型

ObjectMover是什么

ObjectMover的主要功能

ObjectMover的技术原理

ObjectMover的项目地址

ObjectMover的应用场景

发表评价取消回复

最近更新

AutoGLM-Web – AI浏览器助手，模拟用户进行网页浏览与交互

OmniGen – 统一图像生成的扩散模型，支持多模态输入

CogAgent – 清华与智谱AI联合推出的多模态视觉大模型

OMNE Multiagent – 天桥脑科学研究院推出的大模型多智能体框架

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

ObjectMover是什么

ObjectMover的主要功能

ObjectMover的技术原理

ObjectMover的项目地址

ObjectMover的应用场景

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复