Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DGM:自我进化AI Agent!迭代修改自身代码,SWE-bench性能飙升150% | 自改进系统前沿
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > DGM:自我进化AI Agent!迭代修改自身代码,SWE-bench性能飙升150% | 自改进系统前沿
AI 工具AIGC 资讯

DGM:自我进化AI Agent!迭代修改自身代码,SWE-bench性能飙升150% | 自改进系统前沿

站外新闻
最近更新: 2026年6月7日 下午8:27
AI Agent SWE-Bench 代码生成 开放性探索 自改进AI
SHARE

💡 站外导读:在AI智能体追求通用能力的浪潮中,一个核心瓶颈始终存在:如何让系统自主、安全地进化?传统的静态模型难以应对开放世界的复杂任务。DGM(达尔文哥德尔机)应运而生,它通过让AI代理迭代修改自身源代码来主动提升性能,将达尔文进化论与大模型能力相结合,为自改进AI开辟了一条新路径。这不仅关乎技术突破,更触及AI安全与可控性的未来范式。

DGM是什么

DGM(Darwin Gödel Machine)是自改进人工智能系统,通过迭代修改自身代码来提升性能。DGM从其维护的编码代理档案中选择一个代理,基于基础模型生成新版本,然后在编码基准测试中验证新代理的性能。如果性能提升,新代理会被加入档案。DGM的设计灵感来源于达尔文进化论,通过开放性探索策略,从不同起点探索多种进化路径,避免陷入局部最优解。在实验中,DGM在多个基准测试中的性能显著提升,例如在SWE-bench基准测试中性能从20.0%提升至50.0%,在Polyglot基准测试中从14.2%提升至30.7%。DGM的自改进过程在隔离的沙盒环境中进行,确保安全性。

阅读目录
  • DGM是什么
  • DGM的主要功能
  • DGM的工作原理
  • DGM的项目地址
  • DGM的应用场景
      • 📝 站长洞察 (Editor’s Insight)

DGM

DGM的主要功能

  • 自我改进:DGM能迭代地修改自己的代码,优化性能和功能。通过自我修改模块读取自身源代码,基于基础模型生成修改建议。
  • 实证验证:每个代码修改会通过编码基准测试(如SWE-bench和Polyglot)进行验证,确保改进的有效性。评估引擎通过Docker容器隔离和评估新版本代码的性能。
  • 开放性探索:DGM受到达尔文进化论的启发,通过开放性探索策略,从不同起点探索多种进化路径,避免陷入局部最优解。维护一个编码代理档案,不断积累所有生成的变体,支持从档案中的任何代理分支出新的进化路径。
  • 安全性考虑:DGM的执行和自修改过程都在隔离的沙盒环境中进行,限制对宿主系统的影响。

DGM的工作原理

  • 自修改阶段:DGM从其维护的编码代理(coding agents)档案中选择一个代理,基于基础模型(foundation model)生成该代理的一个新版本。
  • 验证阶段:新生成的代理在编码基准测试中进行评估,确定其性能是否提升。
  • 档案更新:经过验证的改进代理被加入到档案中,档案不断积累所有生成的变体。

DGM的项目地址

  • Github仓库:https://github.com/jennyzzt/dgm
  • arXiv技术论文:https://arxiv.org/pdf/2505.22954

DGM的应用场景

  • 自动编程:DGM能自动生成和优化代码,减轻开发者的负担,提高编程效率。可以通过自我改进生成更高效的代码,提升软件的整体性能。
  • 代码优化:DGM可以自动检测代码中的问题并进行优化,提高代码的可读性和执行效率。通过不断迭代改进,DGM能生成更优的代码版本,减少开发时间和成本。
  • 自动修复:DGM通过自我进化可以自动修复发现的问题,降低软件维护成本。能识别代码中的潜在问题,生成修复方案,减少人工干预。
  • 研究平台:DGM为研究自我改进系统提供了实践平台,有助于学术界对该领域的研究。研究人员可以用DGM探索新的算法和模型,推动人工智能技术的发展。

📝 站长洞察 (Editor’s Insight)

DGM的出现,标志着AI发展正从‘被动训练’转向‘主动进化’。其核心在于构建了一个闭环的、受控的‘创造-验证-选择’循环,这不仅是技术上的跃进,更是对‘递归自改进’这一古老AI愿景的严肃实践。与当前主流Agent侧重工具调用不同,DGM将Agent本身作为可编程和可优化的对象,这指向了未来AI系统更根本的灵活性。然而,其‘开放性探索’策略也提出了严峻挑战:如何在鼓励创新与防止失控之间取得平衡?沙盒机制是当下的解决方案,但长远看,这需要与对齐研究、可解释性技术深度结合。DGM不仅是工具,更是一个研究平台,它迫使行业思考:当AI能改进自己时,我们该如何设计它的‘进化目标’与‘安全边界’?这或许是通往更通用、更自主AI道路上必须解决的核心命题。

谷歌Workspace Studio发布:用自然语言打造AI智能体,自动化办公效率提升300%
苹果WWDC2026前瞻:库克卸任前谢幕秀,Siri将引入Google Gemini全面重构
开源AI开发规范新标杆:Qoder Rules 如何提升代码质量与开发效率?
VOGE
KTransformers – 清华开源的大语言模型推理优化框架
TAGGED:AI AgentSWE-Bench代码生成开放性探索自改进AI
分享
Email 复制链接 打印
Share
上一篇 深度解读Circuit Tracer:Anthropic开源的AI模型内部决策可视化与可解释性突破工具
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

深度解读Circuit Tracer:Anthropic开源的AI模型内部决策可视化与可解释性突破工具
AI 工具 AIGC 资讯
云从科技「从容大模型」多模态AI重磅发布:权威评测登顶,超越谷歌OpenAI,赋能金融医疗等多领域
AI 工具 AIGC 资讯
DeepEyes多模态模型:小红书&西安交大联手,90.1%准确率实现AI’用图思考’,超越OpenAI o3
AI 工具 AIGC 资讯
银河通用发布TrackVLA:纯视觉端到端导航大模型,无需建图实现机器人自主智能导航与跟踪
AIGC 资讯 最新趋势

相关推荐

AIGC 资讯

StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成

站外新闻
AIGC 资讯

OpenHands – AI编程工具,多智能体协作实现代码编写、命令运行等

站外新闻
AI 工具AIGC 资讯

DeepSWE开源Agent框架发布:基于Qwen3-32B与强化学习,SWE-Bench准确率59%领跑行业

站外新闻
AI Agent Qwen3-32B 开源框架 强化学习 软件工程
AIGC 资讯

Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.