Nova Sonic – 亚马逊推出的新型生成式 AI 语音模型
Nova Sonic是什么 Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整…
MindLLM – 耶鲁联合剑桥等机构推出的医疗领域 AI 模型
MindLLM是什么 MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型,能将脑部功能性磁共振成像(fMRI)信号解码为自然语言文本。MindLLM基于…
CoA – 谷歌推出的多智能体协作框架
CoA是什么 CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言模型(LLM)在处理长文本任务时面临的上下文限制问题。CoA框架将长文本…
Step-1o Vision – 阶跃星辰推出的原生端到端视觉理解模型
Step-1o Vision是什么 Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务,具备强大的图像识别…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型
Mistral Small 3.1是什么 Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型,有 240 亿参数,基于 Apache …
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束
RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCV…
LongPort MCP – 长桥集团推出的证券业首个券商MCP
LongPort MCP是什么 LongPort MCP(Model Context Protocol)是长桥集团推出的证券行业首个券商MCP。基于 LongPort M…
MathModelAgent – 开源的数学建模Agent,全自动建模流程
MathModelAgent是什么 MathModelAgent 是专为数学建模设计的Agent,能自动完成从问题分析到论文生成的全流程。基于多Agent协作,自动建立数…
OpenDeepSearch – AI搜索工具,支持深度网络搜索和信息检索
OpenDeepSearch是什么 OpenDeepSearch 是开源的深度搜索工具,基于开源推理模型和推理代理提升搜索性能,专为 Hugging Face…
DualPipe – DeepSeek 开源的双向流水线并行技术
DualPipe是什么 DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独…
腾讯混元T1 – 腾讯混元推出的最新深度思考模型
T1是什么 T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、视…
Pollinations.AI – 开源AI内容生成平台,提供免费文本和图像生成API
Pollinations.AI是什么 Pollinations.AI 是开源的AI内容生成平台,提供免费且易于使用的文本和图像生成 API。Pollinations.AI…
协和·太初 – 北京协和与中科院共同推出的罕见病领域AI大模型
协和·太初是什么 协和·太初是北京协和医院与中国科学院自动化研究所共同研发的国内首个罕见病领域AI大模型,正式进入临床应用。模型基于我国罕见病知识库的多年积累和中国人群基…
AppAgentX – 西湖大学推出的自我进化式 GUI 代理框架
AppAgentX是什么 AppAgentX 是西湖大学推出的新型自我进化式 GUI(图形用户界面)代理框架,基于从执行历史中抽象出高级动作提升代理在智能手机交互中的效率…
TPO – AI优化框架,动态调整推理模型的输出,更符合人类偏好
TPO是什么 TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言模型输出进行动态优化,更符合人类偏好。TP…
