Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
AI 工具AIGC 资讯

港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化

站外新闻
最近更新: 2026年6月7日 下午8:04
AI Agent CLI-Anything 开源软件 自动化工具 香港大学
SHARE

💡 站外导读:当前AI Agent自动化仍深陷“截图识别+模拟点击”的GUI困境:界面元素稍有变动便导致任务失败,脆弱不堪。与此同时,专业软件功能强大却“人机绑定”,难以被Agent原生调用。香港大学HKUDS实验室开源的CLI-Anything,正直击这一核心痛点,它能一键将任意开源软件代码库转化为结构化、可编程的命令行接口,让GIMP、Blender等专业工具瞬间“Agent化”,开辟软件自动化新路径。

CLI-Anything是什么

CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的工具,能将任意开源软件的代码库一键转化为 AI Agent 可用的命令行接口(CLI)。工具通过 7 阶段自动化流程(分析、设计、实现、测试等),让 GIMP、Blender、LibreOffice 等专业软件摆脱脆弱的 GUI 自动化,变为稳定、结构化、可编程的 Agent 原生工具,实现”今天的软件为人而生,明天的用户是 Agent”的愿景。

阅读目录
  • CLI-Anything是什么
  • CLI-Anything的主要功能
  • CLI-Anything的技术原理
  • CLI-Anything的项目地址
  • CLI-Anything的应用场景
      • 📝 站长洞察 (Editor’s Insight)

CLI-Anything

CLI-Anything的主要功能

  • 一键生成 CLI:通过单条命令自动完成从源码分析到发布的 7 阶段全流程,将任意开源软件转化为 Agent 可用的命令行工具。
  • 真实软件集成:直接操作现有专业软件(如 GIMP、Blender、LibreOffice),调用真实应用程序处理项目文件。
  • 告别 GUI 自动化:摒弃截图识别和模拟点击的脆弱方案,采用纯命令行交互,消除 UI 元素变动导致的失效风险。
  • 结构化输出:支持 REPL 交互模式和脚本子命令双模式,内置 --json 标志输出结构化数据,便于 Agent 直接消费解析。
  • 生产级测试保障:在 9 个专业软件上完成 1436 个测试用例验证,包含单元测试、E2E 测试及真实软件调用,确保 100% 通过率。

CLI-Anything的技术原理

  • 源码静态分析与 GUI 映射:通过扫描目标软件的源代码,识别图形界面中的操作逻辑、事件处理和 API 调用,将人类点击、拖拽等 GUI 操作映射为可编程的函数接口。
  • 架构设计与状态建模:基于分析结果设计命令组结构,构建状态模型管理软件运行时的上下文(如当前项目、选中对象、编辑历史),定义统一的输入输出格式规范。
  • CLI 框架自动生成:用代码生成技术,基于 Click 等 Python CLI 框架自动构建命令行接口,包含 REPL 交互环境、JSON 序列化输出、撤销/重做机制等 Agent 友好特性。
  • 真实软件调用封装:生成的 CLI 不重新实现功能,通过调用软件原生 API、脚本接口或无头模式(headless)直接驱动真实应用程序,确保功能完整性和兼容性。
  • 测试驱动验证:支持自动生成并执行单元测试和端到端测试,验证生成的 CLI 与目标软件各版本的行为一致性,确保生产环境可靠性。

CLI-Anything的项目地址

  • GitHub仓库:https://github.com/HKUDS/CLI-Anything

CLI-Anything的应用场景

  • 多媒体内容创作:让 AI Agent 直接调用 Blender 进行 3D 建模渲染、使用 GIMP 处理图像、通过 Audacity 编辑音频,实现自动化内容生产流水线。
  • 文档自动化处理:驱动 LibreOffice 批量生成报告、转换格式、填充数据,替代传统模板引擎完成复杂版式文档的智能化生成。
  • 视频后期制作:控制 OBS、Kdenlive、Shotcut 等专业工具,实现自动剪辑、特效添加、多轨道合成与批量导出,大幅提升视频生产效率。
  • 设计工作流集成:将 Inkscape、Krita 等设计软件接入 Agent 系统,完成矢量图生成、批量素材处理、品牌视觉规范自动化执行。
  • 科研与工程计算:扩展至 CAD、EDA、科学计算工具领域,让 Agent 直接操作专业软件完成仿真分析、电路设计、数据可视化等复杂任务。

📝 站长洞察 (Editor’s Insight)

CLI-Anything的发布,标志着AI Agent与软件交互范式正经历根本性跃迁。它超越了单纯的API封装,通过深度源码分析与自动化工程,将人类GUI操作“编译”为Agent原生理解的CLI语言。这不仅是技术突破,更是对“软件为谁而设计”命题的深刻回答——未来软件的“用户”将是Agent。其7阶段流程与生产级测试保障,解决了从实验室到产业落地的关键可靠性瓶颈。该项目预示着一个新趋势:所有专业软件都将标配“Agent接口层”,如同今天的数据库拥有SQL。这是构建下一代自主Agent系统的基础设施级创新,为AIGC、自动化办公、科研计算等领域打开了真正的规模化、工程化应用大门。

Profile Picture AI
字节跳动开源Coze Loop:一站式AI Agent开发调试平台,全面优化Prompt工程与模型监控
Imgcreator AI
Mistral Saba – Mistral AI 推出的首个专业区域语言模型
Pitchyouridea.ai
TAGGED:AI AgentCLI-Anything开源软件自动化工具香港大学
分享
Email 复制链接 打印
Share
上一篇 Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
下一篇 谷歌Gemini Embedding 2重磅发布:首个原生多模态嵌入模型,统一文本图像音频向量空间
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/秒,实时编程交互新时代,Cerebras WSE-3芯片加持
AI 工具 AIGC 资讯
OpenAI发布GPT-5.3 Instant:轻量级模型免费用,AI对话更自然、幻觉率显著降低
AI 工具 AIGC 资讯
GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%
AI 工具 AIGC 资讯
蚂蚁集团发布Ming-flash-omni-2.0:开源全模态大模型,引领AI理解与生成一体化新范式
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

GPT-5.3-Codex-Spark震撼发布:OpenAI首款实时编程模型,速度破千Token/秒,开发者协作体验颠覆

站外新闻
AI编程模型 Cerebras WSE-3 GPT-5.3-Codex-Spark openai 实时编程
AIGC 资讯

Step-Audio-TTS-3B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音

站外新闻
AI 工具AIGC 资讯

突破视觉理解极限!港理工联合腾讯发布UniPixel,像素级多模态大模型重新定义AI看懂世界

站外新闻
UniPixel 像素级视觉理解 多模态大模型 腾讯ARC Lab 香港理工大学
AI 工具

Ameela

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.