Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
AI 工具AIGC 资讯

港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化

站外新闻
最近更新: 2026年6月7日 下午8:04
AI Agent CLI-Anything 开源软件 自动化工具 香港大学
SHARE

💡 站外导读:当前AI Agent自动化仍深陷“截图识别+模拟点击”的GUI困境:界面元素稍有变动便导致任务失败,脆弱不堪。与此同时,专业软件功能强大却“人机绑定”,难以被Agent原生调用。香港大学HKUDS实验室开源的CLI-Anything,正直击这一核心痛点,它能一键将任意开源软件代码库转化为结构化、可编程的命令行接口,让GIMP、Blender等专业工具瞬间“Agent化”,开辟软件自动化新路径。

CLI-Anything是什么

CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的工具,能将任意开源软件的代码库一键转化为 AI Agent 可用的命令行接口(CLI)。工具通过 7 阶段自动化流程(分析、设计、实现、测试等),让 GIMP、Blender、LibreOffice 等专业软件摆脱脆弱的 GUI 自动化,变为稳定、结构化、可编程的 Agent 原生工具,实现”今天的软件为人而生,明天的用户是 Agent”的愿景。

阅读目录
  • CLI-Anything是什么
  • CLI-Anything的主要功能
  • CLI-Anything的技术原理
  • CLI-Anything的项目地址
  • CLI-Anything的应用场景
      • 📝 站长洞察 (Editor’s Insight)

CLI-Anything

CLI-Anything的主要功能

  • 一键生成 CLI:通过单条命令自动完成从源码分析到发布的 7 阶段全流程,将任意开源软件转化为 Agent 可用的命令行工具。
  • 真实软件集成:直接操作现有专业软件(如 GIMP、Blender、LibreOffice),调用真实应用程序处理项目文件。
  • 告别 GUI 自动化:摒弃截图识别和模拟点击的脆弱方案,采用纯命令行交互,消除 UI 元素变动导致的失效风险。
  • 结构化输出:支持 REPL 交互模式和脚本子命令双模式,内置 --json 标志输出结构化数据,便于 Agent 直接消费解析。
  • 生产级测试保障:在 9 个专业软件上完成 1436 个测试用例验证,包含单元测试、E2E 测试及真实软件调用,确保 100% 通过率。

CLI-Anything的技术原理

  • 源码静态分析与 GUI 映射:通过扫描目标软件的源代码,识别图形界面中的操作逻辑、事件处理和 API 调用,将人类点击、拖拽等 GUI 操作映射为可编程的函数接口。
  • 架构设计与状态建模:基于分析结果设计命令组结构,构建状态模型管理软件运行时的上下文(如当前项目、选中对象、编辑历史),定义统一的输入输出格式规范。
  • CLI 框架自动生成:用代码生成技术,基于 Click 等 Python CLI 框架自动构建命令行接口,包含 REPL 交互环境、JSON 序列化输出、撤销/重做机制等 Agent 友好特性。
  • 真实软件调用封装:生成的 CLI 不重新实现功能,通过调用软件原生 API、脚本接口或无头模式(headless)直接驱动真实应用程序,确保功能完整性和兼容性。
  • 测试驱动验证:支持自动生成并执行单元测试和端到端测试,验证生成的 CLI 与目标软件各版本的行为一致性,确保生产环境可靠性。

CLI-Anything的项目地址

  • GitHub仓库:https://github.com/HKUDS/CLI-Anything

CLI-Anything的应用场景

  • 多媒体内容创作:让 AI Agent 直接调用 Blender 进行 3D 建模渲染、使用 GIMP 处理图像、通过 Audacity 编辑音频,实现自动化内容生产流水线。
  • 文档自动化处理:驱动 LibreOffice 批量生成报告、转换格式、填充数据,替代传统模板引擎完成复杂版式文档的智能化生成。
  • 视频后期制作:控制 OBS、Kdenlive、Shotcut 等专业工具,实现自动剪辑、特效添加、多轨道合成与批量导出,大幅提升视频生产效率。
  • 设计工作流集成:将 Inkscape、Krita 等设计软件接入 Agent 系统,完成矢量图生成、批量素材处理、品牌视觉规范自动化执行。
  • 科研与工程计算:扩展至 CAD、EDA、科学计算工具领域,让 Agent 直接操作专业软件完成仿真分析、电路设计、数据可视化等复杂任务。

📝 站长洞察 (Editor’s Insight)

CLI-Anything的发布,标志着AI Agent与软件交互范式正经历根本性跃迁。它超越了单纯的API封装,通过深度源码分析与自动化工程,将人类GUI操作“编译”为Agent原生理解的CLI语言。这不仅是技术突破,更是对“软件为谁而设计”命题的深刻回答——未来软件的“用户”将是Agent。其7阶段流程与生产级测试保障,解决了从实验室到产业落地的关键可靠性瓶颈。该项目预示着一个新趋势:所有专业软件都将标配“Agent接口层”,如同今天的数据库拥有SQL。这是构建下一代自主Agent系统的基础设施级创新,为AIGC、自动化办公、科研计算等领域打开了真正的规模化、工程化应用大门。

Riffusion
Excuse Generator
开源AI视频翻译神器!牛津大学Violin:33种语言配音+口型同步,免费商用
REimagine Home
EmaFusion – AI初创公司 Ema 推出的多模型融合技术
TAGGED:AI AgentCLI-Anything开源软件自动化工具香港大学
分享
Email 复制链接 打印
Share
上一篇 Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
AI 工具
英伟达Nemotron 3 Super开源发布:1200亿参数Mamba-MoE架构,智能体推理速度提升3倍,性能直逼Claude Opus 4.6
AI 工具 AIGC 资讯
阶跃AI发布StepClaw:一键部署云端AI助手,自主进化能力颠覆办公自动化
AI 工具
上海AI Lab开源InternVL-U:4B参数轻量化多模态模型,实现理解-推理-生成-编辑端到端闭环
AI 工具

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

科大讯飞发布AI眼镜:40克超轻机身+星火大模型,掀起百镜大战新浪潮

站外新闻
AI眼镜 星火大模型 百镜大战 科大讯飞 轻量化交互
AI 工具

Vribble

remaker
AIGC 资讯

ZeroSearch – 阿里通义开源的大模型搜索引擎框架

站外新闻
AIGC 资讯

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.