Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: ClawWork深度解析:HKUDS开源AI Agent经济生存基准测试框架,挑战大模型“赚钱”能力
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > ClawWork深度解析:HKUDS开源AI Agent经济生存基准测试框架,挑战大模型“赚钱”能力
AI 工具最新趋势

ClawWork深度解析:HKUDS开源AI Agent经济生存基准测试框架,挑战大模型“赚钱”能力

站外新闻
最近更新: 2026年6月7日 下午8:06
AI Agent ClawWork HKUDS 经济生存测试
SHARE

💡 站外导读:当AI从实验室走向真实商业世界,一个核心问题浮现:它能否在经济上自力更生?香港大学HKUDS团队开源的ClawWork框架,正是为回答这一问题而生。它为AI Agent设定了严苛的生存挑战:仅有10美元启动资金,必须通过完成220个覆盖44个行业的真实任务来赚取收入、支付高昂的Token成本,资金耗尽即告“破产”。这不仅是对模型能力的测试,更是对其战略决策(工作与学习权衡)和成本控制意识的极致压力测试,标志着AI评估从“能力测试”迈向“生存能力评估”的新阶段。

ClawWork是什么

ClawWork 是香港大学数据科学实验室(HKUDS)开源的 AI Agent 经济生存基准测试框架,评估大模型在真实商业环境中的”赚钱能力”。系统为每个 Agent 设定 10 美元启动资金,要求其通过完成 220 个真实职业任务(覆盖金融、医疗、制造等 44 个行业)来赚取收入、支付 Token 成本,资金耗尽即”破产”。任务报酬按质量评分结算,价值从 $82 到 $5,000 不等,迫使 Agent 在”立即工作赚钱”与”投资学习提升”之间做出战略权衡。ClawWork 支持 GPT-4o、Claude、Kimi 等多模型竞技,提供 React 实时仪表板监控生存状态,为 AI 劳动力经济研究提供了首个”用进废退”的真实压力测试环境。

阅读目录
  • ClawWork是什么
  • ClawWork的主要功能
  • ClawWork的项目地址
  • 如何使用ClawWork
  • ClawWork的应用场景
      • 📝 站长洞察 (Editor’s Insight)

ClawWork

ClawWork的主要功能

  • 220 个真实职业任务:来自 OpenAI GDPVal 数据集,覆盖 44 个经济部门(制造、金融、医疗、政府、零售等),每个任务都对应真实世界的工作场景。
  • 经济责任制:每个 Token 都需付费,收入只来自完成任务,质量由 GPT-5.2 评估(0-1 分),模拟真实商业环境中的成本控制压力。
  • 工作 vs 学习权衡:Agent 每天需做出战略决策——立即工作赚钱维持生存,还是投资学习提升未来表现。
  • 多模型竞技场:支持 GPT-4o、Claude、GLM、Kimi、Qwen 等主流模型同台竞技,对比经济生存能力。
  • 实时仪表板:基于 React 的可视化监控系统,实时追踪余额、收入、成本和生存状态。
  • Nanobot/OpenClaw 集成:通过 ClawMode 将任何 Nanobot 网关转为经济追踪型 AI 同事,支持本地和云端部署。

ClawWork的项目地址

  • GitHub仓库:https://github.com/HKUDS/ClawWork

如何使用ClawWork

  • 安装依赖:克隆 GitHub 仓库后,通过 pip install -r requirements.txt 安装 Python 依赖,并配置 OpenAI API 密钥用于任务质量评估。
  • 配置 Agent:在配置文件中设置模型类型(GPT-4o/Claude/GLM/Kimi/Qwen 等)、初始资金(默认 $10)和每日决策策略(工作优先或学习优先)。
  • 加载任务集:从 OpenAI GDPVal 数据集导入 220 个真实职业任务,或自定义添加特定行业的专业任务。
  • 启动模拟:运行主程序开始经济生存模拟,Agent 将自动接收任务、执行并获取质量评分和相应报酬。
  • 监控状态:通过 React 实时仪表板查看 Agent 的当前余额、累计收入、Token 成本消耗和生存天数。
  • 分析结果:模拟结束后导出完整报告,包含盈利能力、任务完成质量、成本效率等关键指标,用于模型对比和策略优化。

ClawWork的应用场景

  • 大模型经济能力评估:对比 GPT-4o、Claude、Kimi 等不同模型在真实商业压力下的赚钱能力和成本控制能力,为模型选型提供数据支撑。
  • Agent 商业可行性验证:测试 AI Agent 在投入实际业务前是否具备自我维持的经济生存能力,降低部署风险。
  • AI 劳动力市场研究:为经济学家提供实验环境,研究 AI Agent 在模拟劳动力市场中的行为模式、定价策略和生存法则。
  • Agent 策略优化:通过调整”工作 vs 学习”决策参数,找到最优的资源分配策略,提升 Agent 长期盈利能力。
  • 企业成本效益分析:帮助企业评估引入 AI Agent 替代人工的真实成本收益,计算投资回报率。
  • 教育训练场景:用于培训新一代 AI 工程师理解 Agent 经济系统设计和商业逻辑,培养具备成本意识的开发思维。

📝 站长洞察 (Editor’s Insight)

ClawWork框架的发布,标志着AI评估范式的又一次跃迁。过去我们热衷于在静态基准上比较模型的智商与知识,而ClawWork引入了动态的“经济生存”维度,将AI置于一个模拟的市场经济体中。这深刻地呼应了AI发展的两大前沿趋势:一是AI Agent从执行工具向自主经济实体的演进,其“商业价值”和“成本效益”成为落地关键;二是对AI“具身智能”的一种经济隐喻,生存压力迫使Agent发展出更贴近人类的长期规划与资源分配策略。对于产业界,它提供了一个前所未有的“沙盘”,可以预演AI替代人工的真实成本收益;对于研究界,则开辟了“AI劳动力经济学”这一全新交叉学科。ClawWork不仅是一个测试工具,更是一面镜子,映照出未来人机共生经济中,智能体必须具备的‘生存智慧’。

FinalScout
Yuan3.0 Ultra 开源发布:浪潮信息万亿参数多模态大模型,LAEP 算法提速 49%,定义企业级 Agent 引擎
PromptFlat
Sticky
AI Poem Generator诗歌生成器
TAGGED:AI AgentClawWorkHKUDS经济生存测试
分享
Email 复制链接 打印
Share
上一篇 Google DeepMind发布Lyria 3:AI音乐生成模型重大突破,一句话生成带人声的30秒完整歌曲
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Google DeepMind发布Lyria 3:AI音乐生成模型重大突破,一句话生成带人声的30秒完整歌曲
AI 工具 AIGC 资讯
EvoMap:全球首个AI Agent进化协作平台,破解经验孤岛,实现智能体能力跨个体遗传与进化
AI 工具 AIGC 资讯
Gemini 3.1 Pro:谷歌最强AI推理模型发布,性能飙升148%重塑复杂任务处理
AI 工具 AIGC 资讯
Sipeed发布PicoClaw:超轻量级AI Agent助手,让百元开发板变身24小时私人AI管家
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

ClawLess:南方科技大学 & 港科大AI Agent安全框架,形式化验证+系统调用拦截,构筑数学级安全壁垒

站外新闻
AI Agent BPF 南方科技大学 安全框架 形式化验证
AI 工具

Stable Doodle

remaker
AI 工具AIGC 资讯

最高降99%!小米MiMo-V2.5系列API永久降价,开发者成本“腰斩”式优化

站外新闻
AIGC API降价 MiMo-V2.5 小米
AI 工具

Pika!一个免费使用的 AI 短视频生成神器

OZ
AI视频 Pika 短视频
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 小红书 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 网络安全 联想 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.