Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 上海交大开源PC Agent-E框架:仅312条数据训练,性能暴涨241%超越Claude 3.7
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 上海交大开源PC Agent-E框架:仅312条数据训练,性能暴涨241%超越Claude 3.7
AI 工具AIGC 资讯

上海交大开源PC Agent-E框架:仅312条数据训练,性能暴涨241%超越Claude 3.7

站外新闻
最近更新: 2026年6月7日 下午8:28
Claude 3.7 Sonnet PC Agent-E 上海交通大学 数据增强 智能体训练
SHARE

💡 站外导读:当前AI智能体在桌面自动化领域面临数据获取成本高、泛化能力弱的核心痛点。传统方法需要海量高质量标注数据,但人工收集成本高昂且效率低下。上海交通大学联合SII推出的PC Agent-E框架,仅用312条人类标注轨迹,通过创新的数据增强技术实现241%的性能提升,在WindowsAgentArena-V2基准测试中超越Claude 3.7 Sonnet,为开源电脑智能体树立新标杆。

PC Agent-E是什么

PC Agent-E是上海交通大学和SII联合推出的高效智能体训练框架。框架用312条人类标注的计算机使用轨迹,基于Claude 3.7 Sonnet模型合成多样化的行动决策,显著提升数据质量。框架包含轨迹收集、思维链补全、轨迹增强和代理训练四个关键部分。PC Agent-E在WindowsAgentArena-V2基准测试中取得241%的性能提升,超越Claude 3.7 Sonnet的extended thinking模式,成为Windows系统上开源电脑智能体的新一代SOTA。

阅读目录
  • PC Agent-E是什么
  • PC Agent-E的主要功能
  • PC Agent-E的技术原理
  • PC Agent-E的项目地址
  • PC Agent-E的应用场景
      • 📝 站长洞察 (Editor’s Insight)

PC Agent-E

PC Agent-E的主要功能

  • 高效训练:仅需312条人类标注轨迹,基于数据增强显著提升模型性能。
  • 跨平台泛化:在OSWorld基准测试中,展示强大的跨平台能力,适用于不同操作系统。
  • 任务执行:支持完成多种复杂任务,如文件操作、软件使用、网页浏览等。
  • 数据增强:基于合成多样化行动决策,丰富轨迹数据,提升模型泛化能力。

PC Agent-E的技术原理

  • 轨迹收集(Trajectory Collection):基于PC Tracker工具记录人类操作轨迹,包括任务描述、屏幕截图和键盘/鼠标操作。用简单的标注过程,收集少量高质量的人类操作轨迹。
  • 思维链补全(Thought Completion):基于Claude 3.7 Sonnet模型为每个动作步骤添加背后的思考逻辑。基于提供任务描述、历史动作和当前状态,生成符合人类思维的推理过程。
  • 轨迹增强(Trajectory Boost):为轨迹的每一步合成更多的动作决策,捕捉任务的多样性。用Claude 3.7 Sonnet模型,为每一步生成多个合理的动作决策,丰富轨迹数据。
  • 代理训练(Agent Training):在开源模型Qwen2.5-VL-72B的基础上进行训练。用简单的端到端训练框架,确保模型能够高效学习并执行任务。
  • 评估与验证:在WindowsAgentArena-V2和OSWorld基准测试中验证模型性能。调整合成动作数量,验证轨迹增强方法对性能提升的关键作用。

PC Agent-E的项目地址

  • 项目官网:https://gair-nlp.github.io/PC-Agent-E/
  • GitHub仓库:https://github.com/GAIR-NLP/PC-Agent-E
  • HuggingFace模型库:https://huggingface.co/henryhe0123/PC-Agent-E
  • arXiv技术论文:https://arxiv.org/pdf/2505.13909

PC Agent-E的应用场景

  • 自动化办公:自动完成文档编辑、数据分析等任务,提高办公效率。
  • 软件测试:模拟用户操作,发现软件中的错误和问题,提升软件质量。
  • 教育辅助:作为虚拟助教,帮助学生完成计算机操作任务,提供即时指导。
  • 辅助残障人士:提供辅助操作功能,方便残障人士使用计算机。
  • 跨平台兼容:在不同操作系统之间迁移和执行任务,实现无缝切换。

📝 站长洞察 (Editor’s Insight)

PC Agent-E的发布标志着AI Agent训练范式的重要转变:从’数据规模驱动’转向’数据质量与多样性驱动’。在当前大模型参数竞赛逐渐饱和的背景下,这一框架展示了通过智能数据增强实现小样本高效训练的可行性,这与行业追求’更少数据、更强性能’的趋势高度契合。框架中的思维链补全与轨迹增强技术,本质上是在构建一个’合成数据引擎’,让AI能够自我学习并扩展操作策略。这种技术路径对推动AI Agent在办公自动化、软件测试等真实场景的落地具有重要意义,也为中小企业和研究机构降低了开发门槛。未来,结合多模态理解与跨平台泛化能力,PC Agent-E有望成为下一代桌面AI Agent的重要基础设施。

F-Lite – Freepik联合FAL开源的文生图模型
宇树科技重磅开源UnifoLM-VLA-0:基于Qwen2.5-VL-7B,单一模型实现12类机器人操作,准确率98.7%
Fourier N1 – 傅利叶推出的首款开源人形机器人
星火纪要 – 科大讯飞推出的会议交流总结和分析平台
阿里巴巴宣布大模型组织架构升级,成立Token Foundry事业部并设立AI未来研究院
TAGGED:Claude 3.7 SonnetPC Agent-E上海交通大学数据增强智能体训练
分享
Email 复制链接 打印
Share
上一篇 CAR:字节跳动×复旦重磅推出!自适应推理框架让大模型效率飙升,准确率再攀新高
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

CAR:字节跳动×复旦重磅推出!自适应推理框架让大模型效率飙升,准确率再攀新高
AIGC 资讯
Onit:开源Mac AI助手,高亮即问、无缝接入多模型,效率飙升
AI 工具
出门问问Mobvoi MCP Server:一站式多模态AI开发平台,集成语音克隆与数字人,开源驱动智能生产力
AI 工具 AIGC 资讯
OmniSync:人大-快手-清华联合打造,通用对口型框架实现无限时长精准同步
AI 工具 AIGC 资讯

相关推荐

AI 工具

Just Prompts

remaker
AI 工具

Automaited

remaker
AI 工具AIGC 资讯

OpenAI GPT-5.4重磅发布:原生操作电脑、百万Token上下文,专业任务首次超越人类

站外新闻
AI Agent GPT-5.4 openai 计算机操作
AI 工具AIGC 资讯

最高降99%!小米MiMo-V2.5系列API永久降价,开发者成本“腰斩”式优化

站外新闻
AIGC API降价 MiMo-V2.5 小米
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.