AIbase 报道 北京时间最新消息,国内 AI 独角兽 MiniMax 即将推出新一代大模型 M3。MiniMax AI 工程负责人 Skyler Miao 近日在社交平台释放预告,称“Something BIG is coming!”,引发业界广泛关注。

image.png

M3核心架构创新:稀疏注意力机制

据悉,M3搭载了全新的稀疏注意力(Sparse Attention)架构,其核心在于将Index Branch的快速索引能力与Sparse Branch的精准计算相结合,从而在超长上下文处理中有效突破了计算性能的限制。

传统 Transformer 在处理百万 Token 级别上下文时,计算量会随序列长度呈平方级增长。而 M3的稀疏设计能大幅降低这一开销,在保持高性能的同时实现显著的效率跃升,为长文本理解、长对话、多文档分析等应用场景提供有力支撑。

实测性能大幅领先 M2

与前代支持1M Token上下文的M2相比,M3在多项关键性能指标上均实现了显著提升:

  • Prefill 阶段速度提升9.7倍
  • Decoding 阶段速度提升15.6倍

这意味着在实际部署中,M3能够以极低的算力成本高效处理超长上下文,显著降低推理成本,并为更复杂的 AI 应用打开想象空间。

行业意义:长上下文时代的效率新标杆

MiniMax此次对M3的预告,再次彰显了国内AI企业在架构设计层面的创新实力。稀疏注意力等关键技术的突破,正推动大模型发展从单纯追求“参数规模”转向注重“效率与实用性”,这将为企业级应用与消费级产品带来更具性价比、更高效能的使用体验。

目前 MiniMax 尚未公布 M3的具体发布时间与完整参数规模,但从工程负责人的预告及性能数据来看,这款模型有望成为长上下文处理领域的有力竞争者。AIbase 将持续关注 MiniMax M3的后续动态,第一时间带来最新报道。