💡 站外导读:在AIGC时代,文本生成图像模型正从“艺术创作”转向“工程控制”。然而,传统模型常面临提示词漂移、细节不可控、版权风险三大痛点。FIBO作为首个原生支持JSON的开源模型,通过超1亿条结构化数据训练,实现了对光线、构图等参数的精准控制,为专业工作流带来了合规且可重复的解决方案,标志着图像生成进入“参数化设计”新阶段。
FIBO是什么
FIBO 是首个开源的原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式,具备特征解耦能力,能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据,确保合规性和法律透明性,适合专业工作流。

FIBO的主要功能
-
文本到图像生成:根据用户输入的文本描述,生成高质量的图像。
-
结构化 JSON 提示:将简短文本提示扩展为详细的结构化 JSON 描述,包含光线、构图、色彩等细节。
-
迭代可控生成:支持从简短提示生成图像,或基于已有 JSON 提示进行多轮细化。
-
特征解耦控制:单独调整某个属性(如相机角度)而不破坏整体场景。
-
灵感模式:通过输入图像提取结构化提示,生成相关图像,激发创意。
-
企业级合规性:100% 使用授权数据,确保法律透明性和可重复性。
-
生产级集成:模型支持 API 接口、ComfyUI 节点及本地推理。
FIBO的技术原理
-
架构:基于 8B 参数的 DiT 架构,采用流匹配(Flow Matching)训练方式。
-
文本编码器:使用 SmolLM3-3B,搭配创新的 DimFusion 条件架构,实现高效的长描述训练。
-
VAE:采用 Wan 2.2,负责图像的编码和解码。
-
VLM 引导:通过视觉语言模型(VLM)将简短文本提示扩展为详细的结构化 JSON 提示。
-
结构化监督:使用结构化 JSON 描述进行训练,促进特征解耦,避免提示词漂移。
-
数据合规性:在超过 1 亿条授权的长结构化 JSON 描述上训练,确保数据合规性。
FIBO的项目地址
- GitHub仓库:https://github.com/Bria-AI/FIBO
- HuggingFace模型库:https://huggingface.co/briaai/FIBO
- 在线体验Demo:https://huggingface.co/spaces/briaai/FIBO
FIBO的应用场景
- 专业设计与创意工作流:为广告、产品设计和平面设计生成高质量图像,支持快速迭代和精准控制,提升创意效率。
- 影视与娱乐:FIBO 能生成电影、游戏和动画的概念艺术与场景设计,助力视觉化创作,加速开发流程。
- 教育与培训:模型能生成教学图像和虚拟实验场景,辅助教育内容制作,提升学习体验。
- 科学研究:模型能将科学数据转化为直观图像,辅助研究展示和数据可视化。
- 医疗与健康:FIBO 可生成医学示意图和虚拟手术场景,支持医学教学和手术培训。
📝 站长洞察 (Editor’s Insight)
FIBO的出现,标志着AI图像生成正从“黑箱艺术”迈向“结构化工程”。其原生支持JSON的核心创新,将视觉创作转化为可编程的精确参数,这背后是行业对可控性、可重复性及企业级合规的刚性需求。它采用的8B参数DiT架构与VLM引导技术,代表了当前SOTA模型的技术前沿。更重要的是,FIBO坚持100%授权数据训练,在数据合规性上树立了标杆,这对于模型的商业落地至关重要。未来,随着AI工作流与创意软件的深度集成,类似FIBO这样具备精准控制与法律透明性的工具,将成为连接AI生成力与产业生产力的核心枢纽,推动AIGC在设计、影视、科研等专业领域实现真正的规模化应用。
