Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率
AI 工具AIGC 资讯

告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率

站外新闻
最近更新: 2026年5月24日 上午2:28
上下文压缩 大模型效率 开源框架 终端智能体 长程任务
SHARE

💡 站外导读:在AI Agent驱动复杂软件工程与运维任务的时代,终端(Shell)输出成为上下文窗口的“隐形杀手”。随着任务轮次增加,海量日志、状态信息与噪声严重膨胀,淹没了关键错误信号,导致模型决策失准并激增Token成本。传统方案依赖人工规则或简单截断,难以平衡信息完整性与上下文效率。行业亟需一种能自动适应环境、智能保留关键信息的压缩新范式。

TACO是什么

TACO 是曼彻斯特大学、北京航空航天大学、香港科技大学以及MAP 团队开源的无需训练、即插即用的终端智能体自进化观测压缩框架。框架解决了多轮命令行任务中 shell 输出噪声累积导致的上下文膨胀,自动从交互轨迹中发现并复用压缩规则,保留关键报错同时过滤冗余日志。框架即插即用、免训练,已集成于 Harbor 的 terminus-2。在 TerminalBench 等基准上,为 DeepSeek-V3.2、Qwen3 等模型带来 1%-4% 准确率提升,显著降低长程任务 token 消耗。

阅读目录
  • TACO是什么
  • TACO的主要功能
  • TACO的技术原理
  • 如何使用TACO
  • TACO的核心优势
  • TACO的项目地址
  • TACO的同类竞品对比
  • TACO的应用场景
      • 📝 站长洞察 (Editor’s Insight)

TACO

TACO的主要功能

  • 自进化规则发现:框架自动从多轮终端交互轨迹中扫描原始 shell 输出,识别冗余模式并生成候选压缩规则,无需人工编写固定提示或启发式策略。
  • 规则在线精炼与修复:根据任务执行的实时反馈迭代调整规则边界,修复过度压缩或遗漏关键信号的问题,确保报错信息与状态反馈不被误删。
  • 全局规则池与跨任务迁移:维护一个持久化的全局规则知识库,使新任务能直接加载并复用先前会话验证过的规则,实现跨仓库、跨命令环境的经验累积。
  • 即插即用免训练集成:以插件形式直接嵌入现有终端 Agent(如 Harbor 框架中的 terminus-2),通过命令行参数开启,无需修改模型架构或进行任何微调。
  • Token 效率与性能双优化:在过滤低价值终端噪声的同时保留关键环境反馈,使长程多轮任务的 token 消耗线性可控,在 TerminalBench 等基准上提升 1%-4% 的准确率。

TACO的技术原理

  • 问题背景:终端 Agent 在多轮任务中将原始 shell 输出完整回填上下文,导致系统日志、进度条等低价值噪声随轮次二次膨胀,淹没关键报错信号并激增 token 成本。
  • 三模块架构:框架由规则发现器、规则精炼器和全局规则池组成。发现器监控输出流,对超长且未被覆盖的内容自动生成结构化压缩规则;精炼器根据任务反馈迭代修复规则边界,防止误删关键信息;全局规则池持久化验证后的规则,供新任务直接加载复用。
  • 在线运行机制:每轮交互优先匹配全局规则池进行压缩,遇到未覆盖的长输出则触发新规则发现,经当前任务验证后汇入全局池。整个流程由外部规划 LLM 驱动,无需训练数据或模型微调,使压缩策略随终端环境动态演化。

如何使用TACO

  • 环境安装:克隆 GitHub 仓库后,在项目根目录执行 pip install -e . 完成依赖安装,TACO 作为 Harbor 框架的 terminus-2 组件直接可用。
  • 快速启动:运行 Harbor 命令并指定 terminus-2 agent,传入模型信息与 TACO 专属参数即可启动,项目内 scripts/run_taco_example.sh 提供可直接修改的模板脚本。
  • 核心参数配置:通过 --ak 前缀传入 enable_compress=True 开启压缩主开关,enable_self_evo=True 激活在线规则进化,同时配置 compress_base_url、compress_api_key 和 compress_model_name 指向任意 OpenAI 兼容的规划 LLM 端点。
  • 常用模式选择:完整体验需同时开启压缩与自进化并配置外部 LLM;若需固定规则做消融实验,追加 freeze_rules=True;若仅使用单任务本地进化而不继承全局规则池,则添加 disable_global_evo=True。
  • 运行控制:使用 --ak max_turns=200 等参数设置单任务轮次上限,通过 model_info 传入 JSON 配置 LiteLLM 的输入输出 token 限制,确保长程任务在可控成本内执行。

TACO的核心优势

  • 即插即用零训练:无需微调主干大模型或改动 Agent 底层架构,直接通过命令行参数开启压缩与自进化。
  • 自进化跨任务迁移:全局规则池让 Agent 在长程多轮任务中持续积累压缩经验,新任务直接继承旧知识。
  • 性能与成本双赢:在 TerminalBench 上为 MiniMax-M2.5、DeepSeek-V3.2、Qwen3-Coder-480B 等模型带来 1%-4% 准确率提升,并在相同 token 预算下再提升约 2%-3%。
  • 强泛化与低消耗:在 SWE-Bench Lite、CompileBench、DevEval、CRUST-Bench 上均保持或提高成功率,同时显著降低总 token 消耗。

TACO的项目地址

  • GitHub仓库:https://github.com/multimodal-art-projection/TACO
  • arXiv技术论文:http://arxiv.org/abs/2604.19572

TACO的同类竞品对比

维度 TACO SWE-agent OpenHands
上下文处理 自进化规则压缩,全局知识池跨任务复用 保留完整原始终端输出,无智能压缩机制 依赖模型原生长上下文或用户自定义提示
训练依赖 完全免训练,即插即用 免训练,但需特定 Docker 环境配置 免训练,需复杂沙箱与运行时环境
跨任务迁移 全局规则池支持跨仓库/跨会话知识累积 单任务会话隔离,历史知识不继承 多任务支持,但无结构化压缩规则复用
Token 效率 显式过滤冗余噪声,长程任务成本线性可控 原始输出回填导致 token 随轮次二次增长 长程任务 token 消耗高,易触顶上下文上限
开源集成 开源,深度集成 Harbor 评估框架 开源,社区生态成熟 开源,通用 Agent 平台

TACO的应用场景

  • 长程软件工程 Agent:在 SWE-Bench 类多轮代码调试、编译测试中抑制日志与终端输出爆炸,保持上下文清晰。
  • 自动化运维与部署:处理大量 shell 返回的冗余系统状态与进程信息,提升 DevOps Agent 的决策稳定性。
  • 代码审查与测试分析:过滤无关编译警告与测试通过信息,精准保留关键报错与代码差异。
  • 学术研究复现与评测:作为 Harbor 框架的 terminus-2 插件,用于终端 Agent 的 token 效率评估与长程能力基准测试。

📝 站长洞察 (Editor’s Insight)

TACO的发布精准击中了AI Agent落地长程任务的核心痛点——上下文管理。其“自进化”机制是亮点,意味着压缩策略能随环境演化,这比静态规则更符合真实世界的动态性。它揭示了一个关键趋势:下一阶段Agent的竞争焦点将从“模型能力”延伸到“系统工程优化”,尤其是上下文工程(Context Engineering)。通过开源集成Harbor框架,TACO为学术界和工业界提供了可复现、可评估的效率提升工具。这不仅是技术优化,更是推动Agent实用化、降低探索成本的重要基础设施。我们预期,类似的“上下文智能管家”将成为未来优秀Agent框架的标配。

Cody
标小智NameGPT名称生成器
Designs AI
LookBook AI
InVideo
TAGGED:上下文压缩大模型效率开源框架终端智能体长程任务
分享
Email 复制链接 打印
Share
上一篇 AI Agent开发革命!strukto-ai开源Mirage虚拟文件系统,用Bash命令统一操作S3、Gmail、GitHub等所有后端
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

AI Agent开发革命!strukto-ai开源Mirage虚拟文件系统,用Bash命令统一操作S3、Gmail、GitHub等所有后端
AI 工具
Multica开源AI Agent协作平台:让Claude Code、Codex成为你的团队正式成员
AI 工具 AIGC 资讯
OpenAI官方命令行工具震撼发布:一键调用GPT-5.5,开发者效率革命已至
AI 工具 AIGC 资讯
谷歌云开源 agents-cli:AI智能体全生命周期CLI工具,从脚本到GKE部署一气呵成
AI 工具

相关推荐

AI 工具

Xpression Camera

remaker
AI 工具

IntentSeek

remaker
AI 工具

Quick Creator

remaker
AI 工具

Synthesys X

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

3D AI AI Agent AIGC AI人像 AI工具 AI换脸 AI智能体 AI海报设计 AI生成视频 AI绘画 AI编程 AI编程工具 AI视频 AI设计 app图标 b站 chatgpt Claude Code DALL-E3 excel meta Midjourney openai Pika prompt runway SDXL Stability AI stable diffusion UI设计 世界模型 丛林 乐高 人像 人工智能 人物 办公自动化 动物 吉卜力 咒语 图像生成 图像生成模型 图标设计 壁纸 多模态大模型 大模型 大模型应用 大语言模型 女性 字节跳动 室内设计 家居 局部重绘 展台 帅哥 建筑 建筑设计 开源工具 开源平台 开源框架 开源模型 微摄影 微软 怪物 提示词 摄影 教程 新闻 日本排放核污水 早报 智能体 智象未来 水果 海报 海报设计 游戏 游戏美术 玻璃 矢量插画 破碎 科幻 穿搭 窗 美食 背景 腾讯混元 芭比 花 表情包 视频编辑 语音合成 赛博朋克 超现实主义 运动 阿里通义 阿里通义千问 风景 食物 香水
Prompt 语宙Prompt 语宙
Follow US
© 2009-2023 Prompt 语宙. Paooo.com. All Rights Reserved.