Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: UNO – 字节跳动推出的创新AI图像生成框架
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > UNO – 字节跳动推出的创新AI图像生成框架
AIGC 资讯

UNO – 字节跳动推出的创新AI图像生成框架

站外新闻
最近更新: 2026年6月8日 上午6:21
SHARE

UNO是什么

UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变换器生成高一致性的多主体数据,采用渐进式跨模态对齐技术,分阶段训练模型,逐步提升生成效果。引入了通用旋转位置嵌入(UnoPE),支持多种分辨率和长宽比的图像生成。

阅读目录
  • UNO是什么
  • UNO的主要功能
  • UNO的技术原理
  • UNO的项目地址
  • UNO的应用场景

UNO

UNO的主要功能

  • 单主体定制生成:UNO能根据一张参考图像生成保持同一主体特征但处于不同场景、姿势或风格的图像。
  • 多主体组合生成:UNO可以接收多个参考图像作为输入,生成包含所有参考主体的新图像。
  • 虚拟试穿与产品展示:UNO支持虚拟试穿功能,可以将特定的产品(如服装、饰品等)放置在不同的人物模型上,展示其效果。可以将产品放置在各种场景中,保持产品的原始特征。
  • 风格化生成:UNO能对参考主体进行风格转换,生成不同风格的图像。
  • 强大的泛化能力:UNO在多个任务中展现了强大的泛化能力,能适应多种应用场景,如单主体和多主体驱动的图像生成,能泛化到id、tryon、style等场景。

UNO的技术原理

  • 高一致性数据合成管道:UNO 利用扩散变换器(Diffusion Transformers)的内在上下文生成能力,生成高一致性的多主体配对数据。能自动创建大规模、高质量的训练数据,解决了数据获取的难题。
  • 渐进式跨模态对齐:UNO 采用渐进式跨模态对齐策略,将训练过程分为两个阶段:
    • 第一阶段:使用单主体上下文生成的数据对预训练的文本到图像(T2I)模型进行微调,使其具备处理单主体驱动生成任务的能力。
    • 第二阶段:引入多主体数据继续训练,增强模型处理复杂场景的能力。通过这种逐步对齐的方式,模型能更好地适应从单主体到多主体的生成任务。
  • 通用旋转位置嵌入(UnoPE):UNO 引入了通用旋转位置嵌入(UnoPE),有效解决了在扩展视觉主体控制时的属性混淆问题。UnoPE 通过为文本和图像标记分配特定的位置索引,调控多模态标记之间的交互,使模型专注于从文本特征中获取布局信息,在保持良好文本可控性的同时,提高主体相似性。
  • 模型架构:UNO 以开源模型 FLUX.1 dev 为基础,继承了其文生图基础能力和多模态注意力机制,采用了通用定制化模型框架。使模型能从文本到图像模型迭代训练而来,通过其独特的渐进式跨模态对齐和通用旋转位置嵌入等机制,实现了在单主体和多主体驱动生成中既能保持高一致性又能确保可控性。
  • 数据管理与模型进化:UNO 采用“模型-数据共同进化”的新范式,核心思想是用较弱的模型生成训练数据,训练更强的模型。让模型在训练过程中逐渐适应多样化场景,能有效应对实际应用中可能遇到的复杂情况。

UNO的项目地址

  • 项目官网:https://bytedance.github.io/UNO/
  • Github仓库:https://github.com/bytedance/UNO
  • HuggingFace模型:https://huggingface.co/bytedance-research/UNO
  • arXiv技术论文:https://arxiv.org/pdf/2504.02160

UNO的应用场景

  • 虚拟试穿:UNO 可以将不同的服装、饰品等产品放置在虚拟人物模型上,生成不同场景下的试穿效果。
  • 产品设计:在产品设计中,UNO 可以将产品放置在各种背景和场景中,保持产品的原始特征,为设计师提供更灵活的设计思路。
  • 创意设计:UNO 能接收多个参考图像作为输入,生成包含所有参考主体的新图像。
  • 个性化内容生成:UNO 可以根据一张参考图像生成保持同一主体特征但处于不同场景、姿势或风格的图像。
  • 角色和场景设计:UNO 可以为游戏开发提供强大的图像生成支持,帮助开发者快速生成角色和场景,激发创意。
谷歌AI搜索频现拼写错误引用户流失,DuckDuckGo下载量飙升:AI准确性危机何解?
BAGEL – 字节跳动开源的多模态基础模型
腾讯云重磅开源Cube Sandbox:AI Agent安全沙箱新标杆,60ms启动+硬件级隔离
物理AI爆发前夜:奥比中光如何用3D视觉“基座”卡位万亿机器人市场?
Context7 – 为大模型和AI编辑器提供最新文档和代码示例的平台
分享
Email 复制链接 打印
Share
上一篇 福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型
AIGC 资讯
Xiaomi MiMo – 小米开源的首个推理大模型
AIGC 资讯
SWE-1 – Windsurf推出的首个软件工程 AI 模型系列
AIGC 资讯
AbletonMCP – AI音乐制作工具,基于MCP支持音轨创建与修改
AIGC 资讯

相关推荐

全息流体渐变通用占位特色图
AIGC 资讯

福布斯AI50榜揭晓!东经科技凭“AI+包装”模式入选,重塑万亿传统制造

站外新闻
AI智能体 东经科技 产业数智化 福布斯中国AI企业TOP50 纸包装行业
AI 工具AIGC 资讯

Luma AI Uni-1.1:全球第三AI图像模型发布,企业级一致性编辑与复杂版面生成

站外新闻
AIGC Luma AI Uni-1.1 企业级AI 图像生成模型
AI 工具AIGC 资讯

阿里Qwen3.6-27B开源!270亿参数碾压万亿级MoE,编程+多模态全能型大模型深度解析

站外新闻
Qwen3.6 多模态AI 智能体编程 稠密大模型 通义千问
AIGC 资讯

DataBuddy – 腾讯云推出的大数据智能体工作台

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.