LIMO – 上海交大推出的高效推理方法,仅需817条训练样本
LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM…
LuminaBrush – AI光源绘制工具,手绘光影线条自动生成光影效果
LuminaBrush是什么 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目,用两阶段方法:第一阶段将图像…
MobileVD – 首个针对移动设备优化的视频扩散模型
MobileVD是什么 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm AI Research团队…
SynthLight – 耶鲁大学联合 Adobe 推出的人像重照明技术
SynthLight是什么 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术,通过模拟不同光照条件下的合成数据进行…
MetaStone-L1-7B – 元石智算推出的轻量级推理模型
MetaStone-L1-7B是什么 MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心…
Titans – 谷歌推出的新型神经记忆架构
Titans是什么 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记忆模块,模拟人脑记忆机制…
LightLab – 谷歌等机构推出的图像光源控制模型
LightLab是什么 LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
PySpur – 开源 AI 代理构建工具,拖拽式构建 AI 工作流
PySpur是什么 PySpur 是开源的轻量级可视化 AI 智能体工作流构建器,简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流,无…
SEMIKONG – 专为半导体领域设计的大型语言模型
SEMIKONG是什么 SEMIKONG是专门为半导体行业定制的大型语言模型(LLM),是Aitomatic、FPT Software和东京电子有限公司联合推出的。基于深…
ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架
ArtCrafter是什么 ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架,基于扩散模型,解决传统方法在风格表达、内容一致性和输出…
NPOA – 开源舆情检测工具,实时监控网络舆情与分析
NPOA是什么 NPOA 是开源的功能强大的舆情监测工具,可以帮助用户实时监控网络舆情,了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术,可以分析大量的网络…
流畅阅读 – 开源AI浏览器翻译插件,支持双语对照显示
流畅阅读是什么 流畅阅读(FluentRead)是开源的浏览器翻译插件,致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术,支持多种翻译引擎,包括传统机器翻译…
OWL – 开源多智能体协作系统,动态交互实现任务自动化
OWL是什么 OWL(Optimized Workforce Learning)是基于CAMEL-AI框架开发的多智能体协作系统,通过智能体之间的动态交互实现高效的任务自…
Soundwave – 港中文深圳开源的语音理解大模型
Soundwave是什么 Soundwave是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,有效解决了…
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
SANA 1.5是什么 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用…
