HUGWBC – 上海交大联合上海 AI Lab 推出的人形机器人全身控制器
HUGWBC是什么 HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大学、上海AI Lab联…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
LHM – 阿里通义开源的单图生成可动画3D人体模型
LHM是什么 LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
Nova Sonic – 亚马逊推出的新型生成式 AI 语音模型
Nova Sonic是什么 Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整…
MindLLM – 耶鲁联合剑桥等机构推出的医疗领域 AI 模型
MindLLM是什么 MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型,能将脑部功能性磁共振成像(fMRI)信号解码为自然语言文本。MindLLM基于…
CoA – 谷歌推出的多智能体协作框架
CoA是什么 CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言模型(LLM)在处理长文本任务时面临的上下文限制问题。CoA框架将长文本…
Step-1o Vision – 阶跃星辰推出的原生端到端视觉理解模型
Step-1o Vision是什么 Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务,具备强大的图像识别…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型
Mistral Small 3.1是什么 Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型,有 240 亿参数,基于 Apache …
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束
RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCV…
LongPort MCP – 长桥集团推出的证券业首个券商MCP
LongPort MCP是什么 LongPort MCP(Model Context Protocol)是长桥集团推出的证券行业首个券商MCP。基于 LongPort M…
MathModelAgent – 开源的数学建模Agent,全自动建模流程
MathModelAgent是什么 MathModelAgent 是专为数学建模设计的Agent,能自动完成从问题分析到论文生成的全流程。基于多Agent协作,自动建立数…
OpenDeepSearch – AI搜索工具,支持深度网络搜索和信息检索
OpenDeepSearch是什么 OpenDeepSearch 是开源的深度搜索工具,基于开源推理模型和推理代理提升搜索性能,专为 Hugging Face…
DualPipe – DeepSeek 开源的双向流水线并行技术
DualPipe是什么 DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独…
