WiseDiag – 杭州智诊科技推出全球领先的医疗大模型
WiseDiag是什么 WiseDiag 是杭州智诊科技推出的全球领先的医疗大模型,专注于基于人工智能技术提升医疗服务的效率和质量。模型具有 730 亿参数和 32k 的…
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant是什么 GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善”爱说教、太啰嗦”的机…
HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型
HealthGPT是什么 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型(Med-LVLM),通过异构知识适应技术实现医…
GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型
GEN3C是什么 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基…
InfiniteYou – 字节跳动开源的身份保持图像生成框架
InfiniteYou是什么 InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的…
MAETok – 港大联合北大等机构推出的自动编码器
MAETok是什么 MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的扩散模型的新型图像标记化方法…
Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
ViDoRAG – 通义联合中科大、上交大推出的视觉文档检索增强生成框架
ViDoRAG是什么 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理,解决传统方法在处…
CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架
CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体(如车辆)与静态场景…
k1.5 – Kimi推出的多模态思考模型
k1.5是什么 k1.5 是月之暗面Kimi推出的最新多模态思考模型,具备强大的推理和多模态处理能力。模型在 short-CoT(短链思维)模式下,数学、代码、视觉多模态…
MM-Eureka – 上海AI Lab联合上交大等推出的多模态推理模型
MM-Eureka是什么 MM-Eureka 是上海人工智能实验室、上海创智学院、上海交通大学和香港大学的研究人员共同开发的多模态推理模型。模型通过基于规则的大规模强化学…
FlowiseAI – AI应用构建工具,拖拽可视化组件自定义LLM应用
Flowise是什么 Flowise 是开源的低代码/无代码工具,帮助用户快速构建和部署基于大语言模型(LLM)的应用程序。通过可视化界面,让用户以拖拽的方式轻松搭建复杂…
AgentCPM-GUI – 清华联合面壁智能开源的端侧GUI智能体模型
AgentCPM-GUI是什么 AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V…
Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型
Vibe Draw是什么 Vibe Draw是开源的 AI 3D建模工具,支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型…
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库
DeepGEMM是什么 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGE…
VersaGen – 实现文本到图像合成中视觉控制能力的生成式 AI 代理
VersaGen是什么 VersaGen是文本到图像合成的生成式AI代理,能实现灵活的视觉控制能力。VersaGen能处理包括单一视觉主体、多个视觉主体、场景背景,这些元…
