FLUX-Text – 阿里推出的多语言场景文本编辑框架
FLUX-Text是什么 FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
BFS-Prover – 字节豆包推出的自动定理证明系统
BFS-Prover是什么 BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型(LLM)的自动定理证明系统,通过改进传统的广度优先搜索(BFS)算法,结合…
LaDeCo – 西安交大联合微软推出的自动图形设计构图方法
LaDeCo是什么 LaDeCo是西安交通大学和微软研究院联合推出的自动图形设计构图方法,基于将设计任务分解为层次化的步骤来实现。LaDeCo对输入的设计元素进行层规划,…
Seer – 上海 AI Lab 联合北大等机构推出的端到端操作模型
Seer是什么 Seer是由上海AI实验室、北京大学计算机科学与技术学院、北京大学软件与微电子学院等机构联合推出的端到端操作模型,实现机器人视觉预测与动作执行的高度协同。…
TIGER – 清华大学推出的轻量级语音分离模型
TIGER是什么 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)…
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型
Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,…
NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互
NEXUS-O是什么 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和…
FlashVideo – 字节联合港大推出的高分辨率视频生成框架
FlashVideo是什么 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视频生成中面临的巨大计算成…
食神 – 老板电器推出的首个烹饪大模型
食神是什么 食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据,结合DeepSeek技术,能精准理解烹饪场景需求。用户可通过语音、文字等方式…
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本
LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM…
LuminaBrush – AI光源绘制工具,手绘光影线条自动生成光影效果
LuminaBrush是什么 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像…
MobileVD – 首个针对移动设备优化的视频扩散模型
MobileVD是什么 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm AI Research团队…
SynthLight – 耶鲁大学联合 Adobe 推出的人像重照明技术
SynthLight是什么 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术,通过模拟不同光照条件下的合成数据进行…
MetaStone-L1-7B – 元石智算推出的轻量级推理模型
MetaStone-L1-7B是什么 MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心…
Titans – 谷歌推出的新型神经记忆架构
Titans是什么 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记忆模块,模拟人脑记忆机制…
