Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Mistral AI开源Leanstral:120B参数仅$18,重新定义AI代码智能体与形式化证明
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > Mistral AI开源Leanstral:120B参数仅$18,重新定义AI代码智能体与形式化证明
AI 工具AIGC 资讯

Mistral AI开源Leanstral:120B参数仅$18,重新定义AI代码智能体与形式化证明

站外新闻
最近更新: 2026年6月7日 下午8:04
AI代码智能体 Mistral AI MoE架构 开源大模型 形式化验证
SHARE

💡 站外导读:当AI编程助手从生成代码迈向确保代码绝对正确,形式化验证成为关键瓶颈。传统方法成本高昂、专家稀缺,限制了高可信软件(如航天、金融系统)的开发。Mistral AI 此刻开源 Leanstral,直击痛点:它不是一个通用的代码生成器,而是一个专为 Lean 4 定理证明器设计的“证明工程师”。这意味着,AI不仅能写代码,更能以数学的严谨性证明其正确性,将人工审查转化为机器自动验证。这标志着AI编程正从“辅助”向“可信”范式跃迁。

Leanstral是什么

Leanstral 是Mistral AI推出的首个开源AI代码智能体,专为Lean 4定理证明器设计。模型采用120B总参数/6B激活参数的稀疏架构,能自动生成形式化证明并验证代码正确性。相比巨型竞品,Leanstral以极低成本(单次$18)实现更高效率,在真实数学代码库(如费马大定理项目)评测中表现优异。模型支持通过MCP协议扩展,已集成至Mistral Vibe平台。

阅读目录
  • Leanstral是什么
  • Leanstral的主要功能
  • Leanstral的关键信息和使用要求
  • Leanstral的核心优势
  • 如何使用Leanstral
  • Leanstral的项目地址
  • Leanstral的同类竞品对比
  • Leanstral的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Leanstral

Leanstral的主要功能

  • 自动形式化证明生成:针对Lean 4证明助手,自动生成严格的数学证明和软件规范验证代码。
  • 代码正确性验证: 通过Lean 4的完备验证器,确保生成的代码符合严格的形式化规范,消除人工审查瓶颈。
  • 智能诊断与修复:支持分析代码失败原因(如识别def与abbrev在类型别名中的差异),提供精确的修复方案。
  • 跨语言转换:支持将其他证明语言(如Rocq/Coq)自动转换为Lean 4代码,保留自定义符号表示。
  • 定理证明辅助:在真实数学代码库(如费马大定理项目)中完成形式化证明和新数学概念的定义。

Leanstral的关键信息和使用要求

  • 开发商:Mistral AI
  • 定位:首个专为Lean 4设计的开源AI代码智能体
  • 架构:稀疏专家混合(MoE),120B总参数 / 6B激活参数
  • 许可证:Apache 2.0(完全开源)
  • 成本:单次$18,pass@2仅$36(对比Claude Sonnet $549)
  • 性能:FLTEval评分29.3(pass@4),超越多数开源竞品
  • Mistral Vibe:零配置集成,输入/leanstall即可使用
  • Labs API:免费/低价端点 labs-leanstral-2603(限时开放)
  • 本地部署:下载开源权重自行运行

Leanstral的核心优势

  • 极致效率:以仅6B激活参数超越千亿级开源模型,实现性能与成本的最佳平衡。
  • 成本革命:单次任务仅需18美元,以Claude Sonnet 1/15的价格实现更优的验证效果。
  • 完全开源:使用Apache 2.0协议开放权重,消除供应商锁定,支持私有化部署与自主可控。
  • 垂直优化:专为Lean 4证明工程深度训练,在真实数学代码库中表现远超通用大模型。
  • 可信验证:支持生成代码附带形式化数学证明,将人工审查瓶颈转化为机器自动验证。
  • 生态兼容:原生支持MCP协议,可无缝集成现有开发工具链与语言服务器。

如何使用Leanstral

  • Mistral Vibe(推荐新手):访问 Mistral Vibe 平台,在对话中输入 /leanstall 命令即可零配置启动,无需安装任何本地环境。
  • Labs API(开发者):调用 API 端点 labs-leanstral-2603,目前限时免费开放,适合集成到自动化工作流或自建应用。
  • 本地部署(高级用户):从官方渠道下载 Apache 2.0 许可的模型权重,在自己的硬件上独立运行,实现完全的数据隐私和控制。
  • 使用建议:配合 lean-lsp-mcp 工具可获得最佳性能,适用于形式化数学证明、高可信软件验证等场景。

Leanstral的项目地址

  • 项目官网:https://mistral.ai/news/leanstral

Leanstral的同类竞品对比

对比维度 模型 规模 FLTEval得分 成本 特点
Leanstral Leanstral-120B-A6B 120B/6B 26.3 (pass@2)
29.3 (pass@4)
31.9 (pass@16)
$18-$290 专为Lean 4优化,开源,MCP扩展
开源竞品 Qwen3.5-397B-A17B 397B/17B 25.4 (pass@4) – 需4轮才能达到Leanstral 2轮效果
Kimi-K2.5-1T-A32B 1T/32B 20.1 (pass@4) – 规模巨大但得分瓶颈明显
GLM5-744B-A40B 744B/40B 16.6 (pass@4) – 参数最大但性能最差
闭源竞品 Claude Opus 4.6 – 39.6 $1,650 质量最高但成本是Leanstral 92倍
Claude Sonnet 4.6 – 23.7 $549 成本是Leanstral 15倍,得分更低
Claude Haiku 4.5 – 23.0 $184 性价比平庸

Leanstral的应用场景

  • 形式化数学证明:在费马大定理等大型数学项目中自动完成形式化证明,正确定义新的数学概念。
  • 高可信软件验证:验证Rust等编程语言代码片段的严格属性,确保 mission-critical 系统的软件正确性。
  • 代码库迁移适配:诊断、修复Lean版本升级导致的破坏性变更,例如自动识别def与abbrev在类型别名中的差异并提供修复。
  • 跨语言代码转换:将Rocq/Coq等其他证明语言代码完整转换为Lean 4,保留自定义符号表示和逻辑结构。
  • 智能调试诊断:模型支持分析编译失败的根本原因,自动生成测试用例复现问题,并给出精确的修复方案与原理说明。

📝 站长洞察 (Editor’s Insight)

Leanstral 的发布,远不止一个新模型的诞生。它预示着两个前沿趋势的交汇:一是“垂直领域模型”在高度专业化任务上,能以极小参数(激活仅6B)超越通用巨模型,效率革命已到来;二是开源力量开始定义硬核技术标准。Mistral 以 Apache 2.0 协议开放权重,直接挑战了闭源模型在代码验证等高端场景的垄断。其成本优势(仅为Claude Sonnet的1/15)将加速形式化方法从学术象牙塔走向工业界。我们判断,结合MCP协议,Leanstral 生态有望成为下一代高可信软件工具链的核心,推动“可验证的AI编程”成为主流。

PixVerse C1:全球首个影视行业大模型,多宫格分镜一键成片与工业级动作引擎深度解析
LangGraph WhatsApp Agent – 用于构建与 WhatsApp 用户互动的 AI Agent
Helix – Figure 推出的端到端通用控制模型
Skywork R1V – 昆仑万维开源的多模态思维链推理模型
Co-Sight – 中兴通讯开源的超级智能体项目
TAGGED:AI代码智能体Mistral AIMoE架构开源大模型形式化验证
分享
Email 复制链接 打印
Share
上一篇 OpenAI发布GPT-5.4 nano:极致速度与成本效益,为高吞吐量任务而生
下一篇 腾讯开源Covo-Audio:70亿参数端到端语音大模型,挑战GPT-4o的实时对话新标杆
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

大晓机器人Kairos 3.0-4B开源:全球首个端侧具身世界模型,推理速度提升72倍!
AI 工具 AIGC 资讯
Paperclip开源平台:用AI Agent组建「赛博公司」,自主运营降本增效新范式
AI 工具 最新趋势
斯坦福重磅开源OpenJarvis:本地AI智能体框架,隐私、成本、延迟全优化
AI 工具 AIGC 资讯
智谱AI发布GLM-5-Turbo:专为龙虾Agent优化,深度解决大模型工具调用与长任务失速难题
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯最新趋势

AI重新定义智能座舱!Rivian高管断言:CarPlay投屏时代已彻底终结

站外新闻
AI智能体 CarPlay Rivian 智能座舱 软件定义汽车
AI 工具

LookBook AI

remaker
全息流体渐变通用占位特色图
AIGC 资讯

AI巨头罕见“踩刹车”:Anthropic警告“AI造AI”时代逼近,呼吁全球放缓研发

站外新闻
AI 工具AIGC 资讯

乐鑫 ESP-Claw 开源:用自然语言对话定义物联网设备行为的 AI Agent 框架

站外新闻
AI Agent ESP32 物联网 自然语言处理 边缘计算
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.