击败谷歌Meta登顶MLE-bench！ML-Master 2.0：国产DeepSeek驱动的自主机器学习智能体，开启AI科研新范式

💡 站外导读：当AI从“辅助工具”迈向“自主科学家”，我们已站在科研范式变革的临界点。然而，让AI独立承担长达数十小时的复杂机器学习任务，仍面临目标漂移、经验遗忘、资源爆炸等严峻挑战。国际巨头竞相布局，中国力量能否脱颖而出？ML-Master 2.0的发布给出了响亮答案——它不仅是一个智能体，更是中国在AI自主科研领域发出的最强音。

ML-Master 2.0是什么

ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0基于国产开源大模型 DeepSeek，具备超长程自主能力，能在长时间科研任务中不断试错、积累经验和自我演化。ML-Master 2.0层次化认知缓存机制可高效管理知识与智慧，显著提升科研效率。在 OpenAI 的 MLE-bench 测试中，ML-Master 2.0 击败谷歌、Meta 等国际顶尖团队，取得全球第一的成绩，展现了中国在 AI 自主科研领域的强大实力，目前已应用于具身智能、理论物理等前沿领域。

阅读目录

ML-Master 2.0是什么
ML-Master 2.0的主要功能
ML-Master 2.0的技术原理
ML-Master 2.0的项目地址
ML-Master 2.0的应用场景

📝 站长洞察 (Editor’s Insight)

ML-Master 2.0

ML-Master 2.0的主要功能

长期科研任务的自主探索：能在长达数十小时的复杂任务中持续工作，围绕同一科研目标进行探索。
经验积累与知识沉淀：从失败中总结规律，将经验转化为可复用的知识和在新任务中迁移应用。
代码生成与调试：自动生成、调试代码，完成实验设计、代码实现、结果分析等完整闭环。
多任务适应性：通过层次化认知缓存机制，跨任务复用高层策略，提升任务适应性。
高效资源管理：在长时间运行中保持稳定的科研节奏，避免上下文爆炸或遗忘历史经验。

ML-Master 2.0的技术原理

超长程自主（Ultra-Long-Horizon Autonomy）：ML-Master 2.0 通过模拟真实科研过程，设计超长程自主机制，能在长时间任务中保持目标一致性，主动避开无效路径。
层次化认知缓存（Hierarchical Cognitive Caching, HCC）：将认知分为三个层次：经验（Experience）、知识（Knowledge）和智慧（Wisdom）。经验用于即时决策，知识是经过验证的稳定结论，智慧是跨任务可复用的高层策略。不同层次的认知在任务中各司其职，通过动态筛选和提升，确保有价值的信息沉淀和噪声信息的淘汰。
深度探索与推理集成：结合探索（Exploration）和推理（Reasoning）能力，通过自适应记忆机制选择性地捕捉和总结关键信息，确保两者相互强化。
基于国产开源大模型 DeepSeek：用国产开源大模型 DeepSeek-V3.2-Speciale，结合高性能 AI 基础设施，实现高效计算和推理能力。

ML-Master 2.0的项目地址

项目官网：https://sjtu-sai-agents.github.io/ML-Master/
GitHub仓库：https://github.com/sjtu-sai-agents/ML-Maste

ML-Master 2.0的应用场景

具身智能机器人训练：ML-Master 2.0能帮助机器人在复杂环境中自主学习和优化行为策略，提升适应性和决策能力。
理论物理模拟与发现：系统能设计复杂物理模拟实验，助力科学家发现新物理规律，加速理论物理研究进程。
机器学习工程任务：ML-Master 2.0 能自动化完成机器学习模型开发、优化等工程任务，通过高效管理知识和经验提升开发效率。
复杂系统建模与优化：用于金融风险模型、气候模型等复杂系统的建模和优化，适应系统动态变化提高模型精度。
自动化科学研究：ML-Master 2.0 能协助科学家设计实验、分析数据和提出假设，推动生物医学、材料科学等领域的研究发展。

📝 站长洞察 (Editor’s Insight)

ML-Master 2.0的发布，标志着AI Agent的竞争已从简单的问答与内容生成，深入到需要长期规划、复杂试错和知识沉淀的硬核科研领域。其核心亮点“层次化认知缓存”极具启发性，它模拟了人类专家的经验、知识、智慧三级认知结构，这或许是破解大模型“健忘”和“无规划”难题的关键钥匙。基于国产DeepSeek大模型取得全球第一，更彰显了中国AI生态在底层模型与上层应用协同创新上的巨大潜力。这不再仅仅是技术的胜利，更是体系化科研创新能力的胜利。未来，拥有“科研大脑”的AI将深刻改变生物医药、材料科学、理论物理等高精尖领域的研发节奏，一个“人机协同、AI主驱”的科研新范式正加速到来。

击败谷歌Meta登顶MLE-bench！ML-Master 2.0：国产DeepSeek驱动的自主机器学习智能体，开启AI科研新范式

ML-Master 2.0是什么

ML-Master 2.0的主要功能

ML-Master 2.0的技术原理

ML-Master 2.0的项目地址

ML-Master 2.0的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价取消回复

最近更新

[AI生图咒语] 严肃职业肖像摄影提示词 (LinkedIn/商务高管头像)

Cosmos 3 Edge – 英伟达开源的 4B 参数世界模型

BigMac – 小红书开源的多模态大模型流水并行训练框架

Kimi K3 攻防考卷翻车：漏洞利用只到美国前沿模型四成，蒸馏疑云被安全机构摆上台

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

Support

ML-Master 2.0是什么

ML-Master 2.0的主要功能

ML-Master 2.0的技术原理

ML-Master 2.0的项目地址

ML-Master 2.0的应用场景

📝 站长洞察 (Editor’s Insight)

发表评价 取消回复

最近更新

相关推荐

发表评价取消回复