Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: MAI-Thinking-1 – 微软推出的首款自研高级推理模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > MAI-Thinking-1 – 微软推出的首款自研高级推理模型
AIGC 资讯

MAI-Thinking-1 – 微软推出的首款自研高级推理模型

站外新闻
最近更新: 2026年6月7日 下午6:02
SHARE

MAI-Thinking-1是什么

MAI-Thinking-1 是微软推出的首款自研高级推理模型。模型采用 35B 活跃参数 / 约 1T 总参数的稀疏 MoE 架构,完全基于干净、商业授权数据从头训练,未使用任何第三方模型蒸馏。在 SWE-Bench Pro、AIME 2025/2026 等关键基准上达到业界顶尖水平,与 Claude Opus 4.6 持平,在盲测中优于 Sonnet 4.6。

阅读目录
  • MAI-Thinking-1是什么
  • MAI-Thinking-1的主要功能
  • MAI-Thinking-1的技术原理
  • 如何使用MAI-Thinking-1
  • MAI-Thinking-1的核心优势
  • MAI-Thinking-1的项目地址
  • MAI-Thinking-1的同类竞品对比
  • MAI-Thinking-1的应用场景

MAI-Thinking-1

MAI-Thinking-1的主要功能

  • 高级数学与科学推理:在 AIME 2025 上达到 97.0%,AIME 2026 上达到 94.5%,具备极强的 STEM 推理能力。
  • 智能软件工程:在 SWE-Bench Pro 上获得 52.8%,在 LiveCodeBench v6 上获得 87.7%,支持多步骤代码阅读、编辑、测试与错误恢复。
  • 超长上下文处理:支持最高 256K 的上下文窗口,可处理长文档与大规模代码库。
  • 工具调用与 Agent 能力:可调用外部工具与环境交互,执行复杂的多步骤任务。
  • 安全与有用性平衡:在 RL 训练中同时优化 helpfulness 和 safety,减少有害输出。

MAI-Thinking-1的技术原理

  • 稀疏 MoE 架构:MAI-Thinking-1 采用 78 层 Decoder-only Transformer,交替使用 8/512 专家激活的稀疏 MoE 层与密集 FFN 层,配合 5:1 局部/全局注意力机制,在保持 35B 活跃参数的同时实现接近 1T 总参数的性能,显著降低推理时的 KV Cache 与计算开销。
  • 数据与预训练:模型基于 30T tokens 的干净、商业授权数据从头预训练,严格排除 AI 生成内容与开源训练集,并对常见基准进行去污染处理;中期训练额外强化 STEM、数学与代码能力,最终支持 256K 超长上下文。
  • 强化学习”爬坡”:微软提出”Hill-Climbing Machine”理念,通过自研 RL 框架从零开始学习推理链,不依赖先验 CoT 蒸馏,分别针对 STEM 推理、Agentic 编码和 Helpfulness & Safety 三个领域进行数千步的持续对数线性提升。
  • 评估体系:内部建立近 40 个 NLL 基准覆盖代码、STEM、数学、通用知识和多语言五大类,优先采用负对数似然非多选题评估,避免格式偏差;同时构建私有基准防止数据污染,确保评估结果真实反映模型能力。

如何使用MAI-Thinking-1

MAI-Thinking-1 的具体使用方式和接入渠道尚未公布。

MAI-Thinking-1的核心优势

  • 完全自研无蒸馏:不继承第三方模型的设计偏见,具备更强的可操控性和适应能力。
  • 中等规模,顶尖性能:35B 活跃参数即可对标 Claude Opus 4.6 等更大模型,推理成本更低,部署更灵活。
  • 数据纯净可追溯:排除 AI 生成内容,确保模型行为可解释、可改进。
  • 全栈自主可控:从微软自研加速器到训练框架、RL 环境均为内部构建,可端到端优化。
  • 持续进化能力:爬坡机器架构支持吸收更优数据、更强奖励和更多算力,实现能力的持续提升。

MAI-Thinking-1的项目地址

  • 项目官网:https://microsoft.ai/news/introducing-mai-thinking-1/
  • 技术论文:https://microsoft.ai/wp-content/uploads/2026/06/main_20260602_2.pdf

MAI-Thinking-1的同类竞品对比

维度 MAI-Thinking-1 Claude Opus 4.6 DeepSeek-R1
架构 35B 活跃 / 1T 总参数 MoE 未公开(大密集模型) 37B 活跃 / 671B 总参数 MoE
训练方式 从头训练,无蒸馏 未公开 基于 DeepSeek-V3 蒸馏
SWE-Bench Pro 52.8% ~52.8%(持平) 约 49-50%
AIME 2025 97.0% 未明确 约 79.8%
上下文长度 256K 200K 128K
数据策略 纯净商业数据,无 AI 生成内容 未明确 开源+合成数据
全栈自主 是(微软自研硬件到框架) 否(Anthropic) 部分(依赖 NVIDIA 生态)

MAI-Thinking-1的应用场景

  • 企业级软件开发:辅助开发者进行代码审查、Bug 修复、功能实现和自动化测试。
  • 科学研究与复杂计算:解决高等数学、物理、化学等复杂推理问题。
  • 长文档分析与知识管理:处理法律合同、技术文档、论文等超长文本的深度理解与摘要。
  • AI Agent 工作流:作为核心推理引擎,驱动自动化办公、数据分析、系统运维等 Agent 任务。
OpenClacky – 李亚飞团队开源的低成本 AI Agent
PilotDeck – 清华联合面壁智能开源的 Agent 操作系统
rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术
NVIDIA发布OmniVinci:全模态大模型实现音视频精准同步,性能碾压Qwen2.5仅需0.2T tokens
Sketch2Anim – 爱丁堡大学等机构推出的2D草图转3D动画框架
分享
Email 复制链接 打印
Share
上一篇 Ideogram 4 – Ideogram 开源的文本到图像生成模型
下一篇 Hermes Desktop – Nous Research 推出的 Hermes 桌面端
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯
联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

影视圈又一重磅联手!生数科技牵手华策,加速 AI 视频从“创意辅助”迈向“真实生产”

站外新闻
AI 工具AIGC 资讯

腾讯混元3D-Omni框架发布:多模态控制信号驱动,精准生成高保真3D资产

站外新闻
3D资产生成 Hunyuan3D-Omni 多模态控制 扩散模型 腾讯混元
AIGC 资讯

反超美国!中国AI大模型周调用量创新高,包揽全球前四

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.