MiniMax 稀宇科技于2026年6月1日正式发布新一代前沿大模型MiniMax M3,这是国内首个集成了顶尖编程、1M超长上下文及原生多模态能力的开源大模型,旨在全面对标海外闭源旗舰。

QQ20260601-092610.jpg

为了解决复杂智能体任务中上下文长度扩展的难题,M3团队从底层开始自主打造了一套稀疏注意力机制(MSA)。与传统方法相比,它通过更精细的KV缓存分块和底层算子优化,让计算速度比同类开源方案快了四倍多。当处理百万级上下文时,M3每个Token的计算成本仅为上一代模型的十分之一到五分之一,在预填充和解码环节分别实现了超过9倍和15倍的效率提升。

QQ20260601-092812.jpg

在原生百万亿量级交错数据的混合训练下,M3的语义空间高度融合,在SWE-Bench Pro等软件工程及多模态权威评测中超越GPT-5.5和Gemini3.1Pro。在极限任务实测中,M3展现出极强的长线程自主规划力,不仅历时12小时自主复现ICLR顶级论文实验,更在无参考代码下连续运行24小时、调用工具近两千次,将Hopper架构上的FP8矩阵乘硬件利用率从7.6%提升至71.3%,并在开放式PostTrainBench中自主调度模型完成“数据-训练-迭代”全流程。

随着M3一同亮相的,还有专为长时间、复杂任务协作设计的MiniMax Code智能体产品,以及极具性价比的Token套餐和API服务,并且官方承诺将在10天内开源模型权重。MiniMax M3的发布,不仅打破了前沿多模态与长上下文技术长期被海外闭源模型垄断的局面,更通过全要素开源的方式,为国内开发者生态重新定义了性价比的边界。