Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率
AI 工具AIGC 资讯

告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率

站外新闻
最近更新: 2026年5月24日 上午2:28
上下文压缩 大模型效率 开源框架 终端智能体 长程任务
SHARE

💡 站外导读:在AI Agent驱动复杂软件工程与运维任务的时代,终端(Shell)输出成为上下文窗口的“隐形杀手”。随着任务轮次增加,海量日志、状态信息与噪声严重膨胀,淹没了关键错误信号,导致模型决策失准并激增Token成本。传统方案依赖人工规则或简单截断,难以平衡信息完整性与上下文效率。行业亟需一种能自动适应环境、智能保留关键信息的压缩新范式。

TACO是什么

TACO 是曼彻斯特大学、北京航空航天大学、香港科技大学以及MAP 团队开源的无需训练、即插即用的终端智能体自进化观测压缩框架。框架解决了多轮命令行任务中 shell 输出噪声累积导致的上下文膨胀,自动从交互轨迹中发现并复用压缩规则,保留关键报错同时过滤冗余日志。框架即插即用、免训练,已集成于 Harbor 的 terminus-2。在 TerminalBench 等基准上,为 DeepSeek-V3.2、Qwen3 等模型带来 1%-4% 准确率提升,显著降低长程任务 token 消耗。

阅读目录
  • TACO是什么
  • TACO的主要功能
  • TACO的技术原理
  • 如何使用TACO
  • TACO的核心优势
  • TACO的项目地址
  • TACO的同类竞品对比
  • TACO的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TACO

TACO的主要功能

  • 自进化规则发现:框架自动从多轮终端交互轨迹中扫描原始 shell 输出,识别冗余模式并生成候选压缩规则,无需人工编写固定提示或启发式策略。
  • 规则在线精炼与修复:根据任务执行的实时反馈迭代调整规则边界,修复过度压缩或遗漏关键信号的问题,确保报错信息与状态反馈不被误删。
  • 全局规则池与跨任务迁移:维护一个持久化的全局规则知识库,使新任务能直接加载并复用先前会话验证过的规则,实现跨仓库、跨命令环境的经验累积。
  • 即插即用免训练集成:以插件形式直接嵌入现有终端 Agent(如 Harbor 框架中的 terminus-2),通过命令行参数开启,无需修改模型架构或进行任何微调。
  • Token 效率与性能双优化:在过滤低价值终端噪声的同时保留关键环境反馈,使长程多轮任务的 token 消耗线性可控,在 TerminalBench 等基准上提升 1%-4% 的准确率。

TACO的技术原理

  • 问题背景:终端 Agent 在多轮任务中将原始 shell 输出完整回填上下文,导致系统日志、进度条等低价值噪声随轮次二次膨胀,淹没关键报错信号并激增 token 成本。
  • 三模块架构:框架由规则发现器、规则精炼器和全局规则池组成。发现器监控输出流,对超长且未被覆盖的内容自动生成结构化压缩规则;精炼器根据任务反馈迭代修复规则边界,防止误删关键信息;全局规则池持久化验证后的规则,供新任务直接加载复用。
  • 在线运行机制:每轮交互优先匹配全局规则池进行压缩,遇到未覆盖的长输出则触发新规则发现,经当前任务验证后汇入全局池。整个流程由外部规划 LLM 驱动,无需训练数据或模型微调,使压缩策略随终端环境动态演化。

如何使用TACO

  • 环境安装:克隆 GitHub 仓库后,在项目根目录执行 pip install -e . 完成依赖安装,TACO 作为 Harbor 框架的 terminus-2 组件直接可用。
  • 快速启动:运行 Harbor 命令并指定 terminus-2 agent,传入模型信息与 TACO 专属参数即可启动,项目内 scripts/run_taco_example.sh 提供可直接修改的模板脚本。
  • 核心参数配置:通过 --ak 前缀传入 enable_compress=True 开启压缩主开关,enable_self_evo=True 激活在线规则进化,同时配置 compress_base_url、compress_api_key 和 compress_model_name 指向任意 OpenAI 兼容的规划 LLM 端点。
  • 常用模式选择:完整体验需同时开启压缩与自进化并配置外部 LLM;若需固定规则做消融实验,追加 freeze_rules=True;若仅使用单任务本地进化而不继承全局规则池,则添加 disable_global_evo=True。
  • 运行控制:使用 --ak max_turns=200 等参数设置单任务轮次上限,通过 model_info 传入 JSON 配置 LiteLLM 的输入输出 token 限制,确保长程任务在可控成本内执行。

TACO的核心优势

  • 即插即用零训练:无需微调主干大模型或改动 Agent 底层架构,直接通过命令行参数开启压缩与自进化。
  • 自进化跨任务迁移:全局规则池让 Agent 在长程多轮任务中持续积累压缩经验,新任务直接继承旧知识。
  • 性能与成本双赢:在 TerminalBench 上为 MiniMax-M2.5、DeepSeek-V3.2、Qwen3-Coder-480B 等模型带来 1%-4% 准确率提升,并在相同 token 预算下再提升约 2%-3%。
  • 强泛化与低消耗:在 SWE-Bench Lite、CompileBench、DevEval、CRUST-Bench 上均保持或提高成功率,同时显著降低总 token 消耗。

TACO的项目地址

  • GitHub仓库:https://github.com/multimodal-art-projection/TACO
  • arXiv技术论文:http://arxiv.org/abs/2604.19572

TACO的同类竞品对比

维度 TACO SWE-agent OpenHands
上下文处理 自进化规则压缩,全局知识池跨任务复用 保留完整原始终端输出,无智能压缩机制 依赖模型原生长上下文或用户自定义提示
训练依赖 完全免训练,即插即用 免训练,但需特定 Docker 环境配置 免训练,需复杂沙箱与运行时环境
跨任务迁移 全局规则池支持跨仓库/跨会话知识累积 单任务会话隔离,历史知识不继承 多任务支持,但无结构化压缩规则复用
Token 效率 显式过滤冗余噪声,长程任务成本线性可控 原始输出回填导致 token 随轮次二次增长 长程任务 token 消耗高,易触顶上下文上限
开源集成 开源,深度集成 Harbor 评估框架 开源,社区生态成熟 开源,通用 Agent 平台

TACO的应用场景

  • 长程软件工程 Agent:在 SWE-Bench 类多轮代码调试、编译测试中抑制日志与终端输出爆炸,保持上下文清晰。
  • 自动化运维与部署:处理大量 shell 返回的冗余系统状态与进程信息,提升 DevOps Agent 的决策稳定性。
  • 代码审查与测试分析:过滤无关编译警告与测试通过信息,精准保留关键报错与代码差异。
  • 学术研究复现与评测:作为 Harbor 框架的 terminus-2 插件,用于终端 Agent 的 token 效率评估与长程能力基准测试。

📝 站长洞察 (Editor’s Insight)

TACO的发布精准击中了AI Agent落地长程任务的核心痛点——上下文管理。其“自进化”机制是亮点,意味着压缩策略能随环境演化,这比静态规则更符合真实世界的动态性。它揭示了一个关键趋势:下一阶段Agent的竞争焦点将从“模型能力”延伸到“系统工程优化”,尤其是上下文工程(Context Engineering)。通过开源集成Harbor框架,TACO为学术界和工业界提供了可复现、可评估的效率提升工具。这不仅是技术优化,更是推动Agent实用化、降低探索成本的重要基础设施。我们预期,类似的“上下文智能管家”将成为未来优秀Agent框架的标配。

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
Solve Intelligence
“纯聊天模式已死”!OpenAI 酝酿史上最大改版,ChatGPT 转型“超级智能体”
GR00T N1 – 英伟达开源的人形机器人基础模型
HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架
TAGGED:上下文压缩大模型效率开源框架终端智能体长程任务
分享
Email 复制链接 打印
Share
上一篇 AI Agent开发革命!strukto-ai开源Mirage虚拟文件系统,用Bash命令统一操作S3、Gmail、GitHub等所有后端
下一篇 阿里Qwen团队重磅开源WebWorld:百万级真实网页世界模型,三大版本赋能下一代智能体
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

AutoMV: 多智能体协作开源AI系统,一键将歌曲生成节奏同步的音乐视频(附项目地址)
AI 工具 AIGC 资讯
阿里通义重磅开源Qwen3-VL-Reranker:跨模态检索精度飙升,多模态AI应用新引擎
AI 工具 AIGC 资讯
香港大学开源DeepTutor:基于知识图谱的AI学习助手,多智能体架构助你高效构建个人知识库
AI 工具
英伟达重磅开源Nemotron Speech ASR:实时语音识别延迟低至24ms,游戏翻译会议全搞定
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

重磅开源|Wall-OSS-0.5:国产具身大模型破解零样本部署难题,无需微调直驱真实机器人

站外新闻
VLA模型 Wall-OSS-0.5 具身智能 自变量机器人
AIGC 资讯

Zerox – 开源的OCR工具,零样本识别多种格式文件

站外新闻
AIGC 资讯

TripoSG – VAST AI 开源的高保真 3D 形状合成技术

站外新闻
量子芯片科技感占位特色图
AI 工具AIGC 资讯最新趋势

AI赋能“一人公司”革命:漳州“单人成军”模式如何颠覆数字贸易创业?

站外新闻
AI+OPC 一人公司 数字贸易 超级个体
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 Midjourney MiniMax Mistral AI MoE MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 昆仑万维 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 知识管理 科大讯飞 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.