GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
TITAN – 哈佛医学院研究推出的多模态全切片病理基础模型
TITAN是什么 TITAN是哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能在无需微调或临床标签的情况下提取通用的切片表示…
FlexRAG – 中科院推出的高性能多模态 RAG 框架
FlexRAG是什么 FlexRAG 是创新的检索增强生成(RAG)框架,解决传统 RAG 系统在处理长上下文时面临的计算成本高和生成质量不足的问题。通过将检索到的上下文…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
Cursor Composer 2模型发布:$2.50/M token逼近GPT-5.4,AI编程Agent性价比新标杆
💡 站外导读:当AI编程助手从单纯的代码补全工具,演进为能自主规划执行复杂任务的智能体(Agent)时,开发者面临的已非“是否使用”的问题,而是如何选择最高效、最经济的伙…
TANGOFLUX – 英伟达联合新加坡科技设计大学开源的文本到音频生成模型
TANGOFLUX是什么 TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40…
GeneralDyG – 南洋理工推出的通用动态图异常检测方法
GeneralDyG是什么 GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
MMedAgent – 专为医疗领域设计的多模态AI智能体,管理多种医疗任务
MMedAgent是什么 MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(M…
OpenHands – AI编程工具,多智能体协作实现代码编写、命令运行等
OpenHands是什么 OpenHands是AI编程工具,支持多智能体协作提高开发效率,减少开发者的编码工作量。OpenHands基于编写代码、与命令行交互和浏览网页等…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架
Hallo3是什么 Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生…
清华联手智谱推出IndexCache:稀疏注意力加速技术,长上下文推理提速近2倍,零性能损失
💡 站外导读:随着大模型上下文窗口迈向百万Token时代,超长文本的处理效率成为AI落地的核心瓶颈。传统稀疏注意力(DSA)中的索引器,在200K上下文下竟占据高达81%…
VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型
VITRON是什么 VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像…
