GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Claude 3.7 Sonnet – Anthropic 推出的首款混合推理模型
Claude 3.7 Sonnet是什么 Claude 3.7 Sonnet 是 Anthropic 公司推出的全球首款混合推理模型,具备“标准模式”和“扩展思考模式”两…
OpenEMMA – 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型
OpenEMMA是什么 OpenEMMA是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架,基于预训练的多模态大型语言模型(MLLMs)处理视觉…
Mobile-Agent – 阿里开源的自主多模态移动设备智能体
Mobile-Agent是什么 Mobile-Agent 是具有移动性的智能代理软件实体,能在网络的各个节点之间移动,代表用户或其他代理进行工作。能根据具体情况中断当前执…
BAG – 港中文联合腾讯推出的3D可穿戴资产生成技术
BAG是什么 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可穿戴资产生成技术,通过结…
SWE-Lancer – OpenAI 推出的大模型基准测试
SWE-Lancer是什么 SWE-Lancer 是 OpenAI 推出的大模型基准测试,评估前沿语言模型(LLMs)在自由职业软件工程任务中的表现。包含来自 Upwor…
TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画
TheoremExplainAgent是什么 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视…
Kiln AI- 开源 AI 原型设计和数据集协作开发工具,微调专属模型
Kiln AI是什么 Kiln AI是开源的 AI 开发工具,能简化大型语言模型(LLM)的微调、合成数据生成和数据集协作。Kiln AI提供直观的桌面应用程序,支持 W…
FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型
FluxSR是什么 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务…
Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型
Avat3r是什么 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量…
TeleAI-t1-preview – 中国电信推出的复杂推理大模型
TeleAI-t1-preview是什么 TeleAI-t1-preview是中国电信人工智能研究院发布的“复杂推理大模型”,具备强大的逻辑推理与数学推导能力。通过强化学…
PSHuman – 开源的单图像3D人像重建技术,仅需一张照片
PSHuman是什么 PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型,仅需一张照片,能生成高度逼真的3D人像模型,包括精细的面部表情和全身姿态。核…
MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
MiniRAG是什么 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关…
StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
StreamBridge是什么 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(Video-LLMs)框架,能帮助 AI 实时理解直播流视频。…
DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计
DeepEP是什么 DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 …
RAG Logger – 专为检索增强生成应用设计的开源日志工具
RAG Logger是什么 RAG Logger是开源的日志记录工具,专为检索增强生成(RAG)应用设计。作为LangSmith的轻量级替代品,专注于满足RAG应用的日志…
