LLaVA-Rad – 微软推出的小型多模态模型,专注于临床放射学报告生成
LLaVA-Rad是什么 LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部X光(CXR)成像。基于…
Motia – AI Agent 开发框架,支持多种编程语言、一键部署智能体
Motia是什么 Motia 是专为软件工程师设计的 AI Agent 框架,简化 AI 智能体的开发、测试和部署过程。支持多种编程语言,如 Python、TypeScr…
ASAP – 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架
ASAP是什么 ASAP(Aligning Simulation and Real Physics)是卡内基梅隆大学和英伟达联合推出的,用在解决仿人机器人模拟与现实动力学…
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT‑5.4是什么 GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万T…
Spark-TTS – AI文本转语音工具,支持中英零样本语音克隆
Spark-TTS是什么 Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 L…
VARGPT – 北大推出的多模态理解生成统一模型
VARGPT是什么 VARGPT是创新的多模态大语言模型,专注于视觉理解和生成任务。基于自回归框架,将视觉生成与理解统一在一个模型中,避免任务切换的复杂性。VARGPT在…
DeepSeek-R1 – DeepSeek推出的高性能AI推理模型,性能对标OpenAI o1正式版
DeepSeek-R1是什么 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。DeepSeek-R1推…
文心大模型X1 – 百度推出的深度思考模型
文心大模型X1是什么 文心大模型X1是百度推出的深度思考模型。具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等。X1增加了多模态能力,能理解和生成图片,能调用工具…
MiniCPM-o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-4o
MiniCPM-o 2.6是什么 MiniCPM-o 2.6 是MiniCPM-o 系列最新、性能最佳的多模态大模型,具有 8B 参数量。MiniCPM-o 2.6在视觉…
WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
WorldPM是什么 WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示…
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
GPT‑5.3‑Codex‑Spark是什么 GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebra…
AgentRefine – 北京邮电大学联合美团推出的智能体合成框架
AgentRefine是什么 AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架,通过“精炼调整”(Refinement Tuning)提升基于大型语言…
Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术
Wonderland是什么 Wonderland是多伦多大学、Snap和UCLA的研究团队推出的技术,能够从单张图像生成高质量、广范围的3D场景,允许控制摄像轨迹。证明了…
MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法
MultiBooth是什么 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图…
WiseDiag – 杭州智诊科技推出全球领先的医疗大模型
WiseDiag是什么 WiseDiag 是杭州智诊科技推出的全球领先的医疗大模型,专注于基于人工智能技术提升医疗服务的效率和质量。模型具有 730 亿参数和 32k 的…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
