今日,Step3.7Flash 正式亮相,这款开源模型直指 Agent 时代核心痛点——效率、可靠性和多模态执行能力,以开放权重(Apache2.0协议)的方式迅速引发业界关注。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基准测试领跑,实战能力突出

Step3.7Flash 在多项关键评测中取得亮眼成绩:

  • ClawEval-1.1排名第一(67.1分)
  • SimpleVQA Search 排名第一(79.2分)
  • SWE-PRO 排名第二(56.3分)
  • V* Python 得分高达95.3

这些成果充分表明,它在处理智能体任务、生成代码、进行视觉搜索等多种复杂应用时,均展现出领先的实力。

核心参数:速度、成本与能力的均衡之作

作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型,Step3.7Flash 在速度与效能上实现显著突破:

  • 推理速度:达到400TPS
  • 架构:198B 稀疏 MoE 结构,活跃参数约11B
  • 上下文长度:支持256K
  • 推理层级:提供3种推理级别

该模型不仅性能出众,还能大幅削减实际部署所需的成本,为开发者提供了一个兼具效率与经济性的优质选项。

多模态理解 + 可靠执行,真正“看见就能做”

Step3.7Flash 的最大亮点在于其强大的感知 – 行动闭环能力。它能够理解 UI 界面、图表、文档和图像等视觉内容,并据此自主编写代码或调用工具完成操作。

其升级后的 Web+ 视觉搜索能力,能够接入更广泛的信息渠道,并支持对搜索结果进行深入的追踪提问。此外,工具调用的稳定性得到了显著增强,在τ²-bench 的所有难度测试中,成功率均超过98%,从而有效改善了常见的目标偏移和调用失败现象。

生态兼容与本地部署友好

模型已与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等协议实现良好兼容。同时,它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地运行,为本地化部署和隐私敏感场景提供了便利。

AIbase 评论:Step3.7Flash 的发布,意味着开源智能体模型正从最初的‘可用’阶段,朝着‘易用、可靠、高效’的方向迈出了关键一步。在智能体日益成为 AI 核心应用模式的今天,像这样能够在运行速度、使用成本与任务执行可靠性之间取得良好平衡的模型,有望成为开发者打造下一代智能工作流的关键基础。

项目地址:https://github.com/stepfun-ai/Step-3.7-Flash