Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Ming-flash-omni-2.0是什么 Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界S…
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统
Hunyuan3D 2.0是什么 Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程…
Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型
Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长…
RAGEN – 训练大模型推理 Agent 的开源强化学习框架
RAGEN是什么 RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Act…
Being-M0 – 北大联合人民大学推出的人形机器人通用动作生成模型
Being-M0是什么 Being-M0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。Being-M0 基于业界首个百万级动作数据集 M…
Hi3DGen – 港中文、字节、清华联合推出的3D几何生成框架
Hi3DGen是什么 Hi3DGen 是香港中文大学(深圳)、字节跳动和清华大学的研究人员共同推出的高保真3D几何生成框架。能从2D图像生成高保真3D模型,通过基于法线图…
EPLB – DeepSeek 开源的专家并行负载均衡器
EPLB是什么 EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的专家并行负载均衡器,能解决大规模模型训练中不同专家…
ImageRAG – 基于检索增强生成的图像生成技术
ImageRAG是什么 ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像…
Kimina-Prover – 月之暗面联合 Numina 推出的数学定理证明模型
Kimina-Prover是什么 Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行…
HiveChat – 开源 AI 聊天机器人,支持Deepseek等主流 AI 模型
HiveChat是什么 HiveChat 是为中小团队设计的 AI 聊天应用,支持多种主流 AI 模型,如 OpenAI、Claude、Gemini 和 Deepseek…
GO-1 – 智元机器人推出的首个通用具身基座模型
GO-1是什么 GO-1(Genie Operator-1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-…
PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具
PDF to Podcast是什么 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动…
3DV-TON – 阿里达摩院联合浙大等推出的视频虚拟试穿框架
3DV-TON是什么 3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿…
Qwen2.5-VL-32B – 阿里开源的最新多模态模型
Qwen2.5-VL-32B是什么 Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具…
Ola – 清华联合腾讯等推出的全模态语言模型
Ola是什么 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,…
Dream-7B – 港大联合华为诺亚方舟开源的扩散推理模型
Dream-7B是什么 Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和…
