Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: A3 Lab发布GenericAgent:仅3300行代码打造100%任务完成、Token消耗降低85%的自进化AI智能体
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > A3 Lab发布GenericAgent:仅3300行代码打造100%任务完成、Token消耗降低85%的自进化AI智能体
AI 工具AIGC 资讯

A3 Lab发布GenericAgent:仅3300行代码打造100%任务完成、Token消耗降低85%的自进化AI智能体

站外新闻
最近更新: 2026年5月24日 上午2:29
A3 Lab AI Agent 上下文工程 大模型 自进化系统
SHARE

💡 站外导读:当前大模型Agent开发普遍面临工具臃肿、上下文窗口过长、经验无法复用的困境。团队常需在强大能力与高昂Token成本间艰难抉择,且Agent能力难以跨任务持续累积。A3 Lab提出的GenericAgent系统,直击这一核心痛点,通过极致精简的架构设计,实现了能力、效率与进化性的统一,为通用智能体的实用化开辟了新路径。

GenericAgent是什么

GenericAgent(GA)是 A3 Lab 推出的通用自进化 LLM Agent 系统,以”上下文信息密度最大化”为核心设计原则。GenericAgent通过 9 个原子工具、30k 上下文窗口和四层分层记忆架构,在 Lifelong AgentBench 上实现 100% 任务完成率,token 消耗为 Claude Code 的 27.7% 和 OpenClaw 的 15.5%。GenericAgent支持经验沉淀为可复用 SOP 与可执行代码,具备跨任务自进化能力,代码量仅 3300 行,以自托管 CLI 形式运行。

阅读目录
  • GenericAgent是什么
  • GenericAgent的主要功能
  • GenericAgent的技术原理
  • 如何使用GenericAgent
  • GenericAgent的关键信息和使用要求
  • GenericAgent的核心优势
  • GenericAgent的项目地址
  • GenericAgent的同类竞品对比
  • GenericAgent的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GenericAgent

GenericAgent的主要功能

  • 极简原子工具集:提供 file_read、file_patch、file_write、code_run、web_scan、web_execute_js、update_working_checkpoint、start_long_term_update、ask_user 共 9 个原子工具,覆盖文件操作、代码执行、网页交互、记忆管理与人工介入五大能力域。
  • 分层按需记忆:采用 L0 元规则、L1 索引层、L2 事实层、L3 SOP 层、L4 原始归档层的四级架构,用 L1 常驻上下文,深层记忆按需显式读取。
  • 自进化能力:将验证后的执行轨迹沉淀为可复用 SOP 文件与可执行脚本,遵循”No Execution, No Memory”原则,实现跨任务经验累积与能力进化。
  • 上下文压缩管理:通过工具输出截断、标签级压缩、消息驱逐与工作记忆锚点四阶段策略,将活跃上下文稳在 30k token 以内。
  • 双模式执行:支持 Interact 模式处理用户主动任务,以及 Reflect 模式作为 Watchdog 自动监测环境变化并触发任务。

GenericAgent的技术原理

  • 上下文信息密度最大化:将上下文质量拆解为完整性(Completeness)、简洁性(Conciseness)与自然性(Naturalness)三维度,通过极简工具、分层记忆、自进化与压缩机制,在有限窗口内最大化决策相关信息比例。
  • 工具最小化与组合泛化:基于原子性(不可再拆)与组合泛化(复杂行为通过序列组合实现)两个条件,保留 9 个原子工具,避免工具膨胀带来的 prompt 开销与策略歧义。
  • 分层记忆架构:L1 索引层仅记录”某类知识存在”而非内容,由 LLM 充当解码器按需取回;引入 meta-memory 元记忆层定义全局规则与更新边界;采用触发式提交而非即时写入,经验经验证后才增量写入长期记忆。
  • 自进化管道:工具层与知识层分离,新任务学习不干扰既有技能;在里程碑事件触发整合阶段,保留经成功工具执行验证的内容;引入三级失败升级机制(局部修复→策略切换→人工介入)防止错误循环。
  • 四阶段上下文截断:阶段一按字符阈值裁剪工具返回值;阶段二每约 5 轮替换重复工作记忆块并截断标签内容;阶段三按 FIFO 驱逐最旧消息;阶段四附加工作记忆锚点作为长期记忆唯一来源。

如何使用GenericAgent

  • 环境准备:确保本地具备 Python 运行环境,准备好兼容的 LLM API Key(支持 Claude、GPT、Gemini 等后端)。
  • 获取代码:通过论文发布渠道(arXiv:2604.17091)获取约 3300 行核心源码与部署指引。
  • 配置安装:在本地完成依赖安装与 LLM 后端配置,设定 30k token 的上下文预算与字符预算阈值。
  • 启动运行:以自托管 CLI 形式启动 GA,进入 Interact 模式可直接输入任务指令,或配置 Reflect 模式的触发脚本实现自动监测。
  • 任务执行:Agent 基于当前任务与相关记忆构建执行上下文,生成工具调用或输出,通过结构化反馈更新系统状态。
  • 经验沉淀:任务完成后,系统自动将验证后的执行轨迹压缩并归档至 L4,经触发整合后沉淀为 L2/L3 长期记忆,供后续任务复用。

GenericAgent的关键信息和使用要求

  • 开发团队:由 A3 Lab(Advantage AI Agent Lab,深圳 Aquaintelling 科技与复旦大学联合研究团队)开发。
  • 开源形态:核心代码约 3300 行,中央 Agent Loop 仅 92 行,以自托管 CLI 程序形式部署,命令行为原生执行界面。
  • 模型兼容:模型无关架构,支持 Claude、GPT、Gemini 等主流 LLM 后端,可替换而不影响执行逻辑与工具接口。
  • 上下文预算:默认将活跃上下文控制在 30k token 以内,采用字符域启发式(α≈3 chars/token)进行预算管理。
  • 执行边界:单会话默认 30 轮执行上限,支持通过子 Agent 派发实现多进程隔离与长程任务拆分。
  • 使用门槛:需配置 LLM API Key,具备本地计算环境运行权限,适合有技术背景的用户自托管部署。

GenericAgent的核心优势

  • 极致 Token 效率:在 Lifelong AgentBench 上用 222k 输入 token 实现 100% 完成率,较 Claude Code 降低 72.3%,较 OpenClaw 降低 84.5%。
  • 持续自进化:9 轮重复任务后 token 消耗下降 89.6%,LLM 调用从 32 次收敛至 5 次,实现”冷启动-快速收敛”的复利效应。
  • 极简架构:3300 行核心代码 vs OpenClaw 的 53 万行,极简设计使 Agent 具备读懂并修改自身架构的潜力。
  • 高密度记忆:装入 20 个技能后完整 prompt 仅 2298 token,较 Claude Code(22821)、Codex(23932)、OpenClaw(43321)降低一个数量级。
  • 强网页能力:在 WebCanvas、BrowseComp-ZH、Custom Tasks 上得分均超 OpenClaw,token 消耗仅为其 1/4-1/3。

GenericAgent的项目地址

  • GitHub仓库:https://github.com/lsdefine/GenericAgent
  • arXiv技术论文:https://arxiv.org/pdf/2604.17091

GenericAgent的同类竞品对比

维度 GenericAgent OpenClaw Claude Code
核心代码量 ~3,300 行 ~530,000 行 未公开
原子工具数 9 个 18 个工具工厂 + 插件 53 个
上下文策略 30k 压缩窗口 依赖 1M 扩展窗口 依赖长上下文
Lifelong AgentBench 完成率 100% 70% 75%
Lifelong AgentBench 输入 Token 222k 1.43M 800k
自进化能力 经验沉淀为 SOP/代码 无显著收敛趋势 无跨会话记忆
记忆架构 四层分层按需加载 检索增强原始日志 无持久记忆
网页浏览 Token 效率 0.18M (WebCanvas) 0.71M 未评测

GenericAgent的应用场景

  • 长程软件工程:GenericAgent支持 GitHub 仓库研究、多文件代码重构、复杂代码编辑与调试等需要持续多轮交互的开发任务。
  • 自动化网页浏览:GenericAgent能执行电商价格比较、上市公司报告提取、航班查询导出、新闻订阅流验证等需要跨页面操作的信息检索任务。
  • 金融与商业分析:在 RealFin-benchmark 等场景中完成动态金融数据爬取、财务报表分析等数据密集型研究任务。
  • 政府与教育机构服务导航:完成政府服务网站导航、大学课程归档等需要跨页面状态转移的复杂流程自动化。
  • 终身个人助手:作为跨会话累积用户偏好、工作习惯与外部服务知识的个人 Agent,持续进化以适配用户长期需求。

📝 站长洞察 (Editor’s Insight)

GenericAgent的发布标志着AI Agent设计哲学从“暴力堆料”转向“精巧工程”。其核心启示在于:1) **上下文即生产力**:通过“信息密度最大化”原则,将30k窗口用到极致,这比盲目扩展上下文窗口更具性价比;2) **记忆是进化的载体**:四层分层记忆与“No Execution, No Memory”原则,让经验沉淀为可复用的SOP,实现了类似人类的技能复利,这是智能体从“工具”迈向“助理”的关键一步;3) **极简架构蕴含巨大潜力**:3300行代码不仅降低维护成本,更让Agent具备自我认知与改进的可能。在行业热议“大模型即服务”时,GenericAgent证明了在Agent层,精巧的系统设计能释放出比模型参数本身更大的杠杆效应。这预示着,未来Agent竞争的制高点将不仅是底层模型,更是围绕上下文、记忆与进化的顶层设计能力。

小米MiMo-V2-Flash开源大模型:150亿参数击败Claude 4.5,推理成本仅2.5%
Jounce AI
阿里通义Fun-ASR1.5重磅发布:单模型支持30语言+方言识别,MoE架构引领ASR新纪元
Never AI头像
AI颠覆开店选址!高德×钉钉悟空发布智能助手,告别‘蹲点’时代
TAGGED:A3 LabAI Agent上下文工程大模型自进化系统
分享
Email 复制链接 打印
Share
上一篇 Models.dev 开源了!一站式 AI 模型数据库,开发者选型成本估算终极指南
下一篇 Luma AI Uni-1.1:全球第三AI图像模型发布,企业级一致性编辑与复杂版面生成
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具

FIBO:首个原生支持JSON的开源图像生成模型,精准控制光线构图色彩

站外新闻
AIGC FIBO 企业级合规 图像生成模型 结构化JSON
AI 工具

Sider

remaker
AI 工具

UGC Scripts

remaker
AIGC 资讯

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.