Omni Reference – Midjourney V7推出的图像参考功能
Omni Reference是什么 Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图…
瀚海智语 – 海洋垂直领域大模型,基于360 智脑和 DeepSeek 研发
瀚海智语是什么 瀚海智语(OceanDS)是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型,模型以360智脑13B和Dee…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Agno – 用于构建多模态智能体的轻量级框架
Agno是什么 Agno是构建智能代理(Agents)的轻量级框架。Agno 支持多模态(文本、图像、音频、视频)和多代理协作,能快速创建代理,速度比 LangGraph…
DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型
DeepCoder-14B-Preview是什么 DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型…
MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型
MiniMind是什么 MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25…
Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练
Oumi是什么 Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模…
3DIS-FLUX – 浙大联合哈佛推出的多实例生成框架
3DIS-FLUX是什么 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构建和FLUX模型的扩散变…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统
Hunyuan3D 2.0是什么 Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程…
Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型
Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长…
RAGEN – 训练大模型推理 Agent 的开源强化学习框架
RAGEN是什么 RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Act…
Being-M0 – 北大联合人民大学推出的人形机器人通用动作生成模型
Being-M0是什么 Being-M0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。Being-M0 基于业界首个百万级动作数据集 M…
Hi3DGen – 港中文、字节、清华联合推出的3D几何生成框架
Hi3DGen是什么 Hi3DGen 是香港中文大学(深圳)、字节跳动和清华大学的研究人员共同推出的高保真3D几何生成框架。能从2D图像生成高保真3D模型,通过基于法线图…
EPLB – DeepSeek 开源的专家并行负载均衡器
EPLB是什么 EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的专家并行负载均衡器,能解决大规模模型训练中不同专家…
ImageRAG – 基于检索增强生成的图像生成技术
ImageRAG是什么 ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像…
