Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%
AI 工具AIGC 资讯

GPT-5.4重磅发布:OpenAI旗舰模型首次在电脑操作上超越人类,专业工作效率提升83%

站外新闻
最近更新: 2026年6月7日 下午8:28
AI模型 GPT-5.4 openai 人工智能 办公自动化
SHARE

💡 站外导读:当AI还在被讨论能否取代人类工作时,OpenAI悄然投下了一颗重磅炸弹——GPT-5.4。这不再是一个只能聊天或写代码的模型,而是一个能够“看”屏幕、“用”鼠标键盘、真正操作电脑完成任务的数字员工。从制作PPT、财务建模到自动发邮件、填表单,它在83%的专业测试中达到了人类专家水平,更在电脑操作任务上首次超越人类。这意味着,AI正从“问答工具”迈入“执行伙伴”的新阶段,一场深刻的工作范式革命已经到来。

GPT‑5.4是什么

GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万Token上下文整合进单一模型,且未牺牲任何单项性能。在OSWorld电脑操作测试中,以75%成功率首次超越人类水平;在GDPval知识工作测试中,83%的任务达到或超过专业人士水准。GPT-5.4支持截图理解界面并执行鼠标键盘操作,可独立完成跨应用复杂任务,标志着AI从”回答问题”向”完成任务”的关键转变。

阅读目录
  • GPT‑5.4是什么
  • GPT‑5.4的主要功能
  • GPT‑5.4的性能表现
  • 如何使用GPT‑5.4
  • GPT‑5.4的产品定价
  • GPT‑5.4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GPT‑5.4

GPT‑5.4的主要功能

  • 原生计算机操作:通过截图理解界面,执行鼠标点击和键盘输入,跨应用完成复杂任务(如发邮件、填表单、操作网页),OSWorld 测试成功率 75%,首次超越人类水平。
  • 深度知识工作:支持处理 44 种职业的真实工作任务,包括制作 PPT、财务建模、数据分析、法律文档分析等,GDPval 测试 83% 达到或超过专业人士水准。
  • 高阶编程与调试:整合 GPT-5.3-Codex 能力,支持代码生成、审查和优化;新增 Playwright Interactive 实现边写代码边可视化调试,可自动测试 Web 应用。
  • 智能工具调用:引入工具搜索机制,按需查询工具定义,Token 消耗降低 47%;支持多步骤任务中灵活调用外部工具和 API。
  • 深度网页搜索:支持多轮持续搜索、筛选信息并整合结果,BrowseComp 测试达 82.7%,擅长处理” needle-in-a-haystack “类复杂查询。
  • 超长上下文处理:API 支持最高 100 万 Token 上下文,可一次性处理完整项目文档;支持高达 1024 万像素的高保真图像输入。
  • 实时任务调控:复杂任务前先展示工作计划,执行中可随时调整方向,无需重新开始。
  • 多模态视觉理解:视觉推理、文档解析和界面识别能力显著提升,支持高分辨率图像和复杂界面操作。

GPT‑5.4的性能表现

  • 知识工作:
    • GDPval 测试:83.0% 的任务达到或超过行业专家水平(GPT-5.2 仅 70.9%)。
    • 投行级表格建模:87.3%(GPT-5.2 为 68.4%)。
    • PPT 生成:人类评审68% 更偏好 GPT-5.4。
  • 计算机操作:
    • OSWorld-Verified:75.0% 成功率,首次超越人类基线 72.4%,GPT-5.2 仅 47.3%。
    • WebArena-Verified:67.3%,浏览器任务处理能力领先。
    • Online-Mind2Web:92.8%,纯截图观察即可精准操作网页。
  • 编程能力:
    • SWE-Bench Pro:57.7%,略超 GPT-5.3-Codex(56.8%),同时延迟更低、Token 效率更高。
    • Terminal-Bench 2.0:75.1%,终端任务处理表现稳健。
  • 工具与搜索:
    • BrowseComp:82.7%(Pro 版高达 89.3%),较 GPT-5.2(65.8%)提升 17 个百分点,创业界新高。
    • Toolathlon:54.6%(GPT-5.2 为 45.7%),多步骤工具调用更准确。
    • Token 消耗:降低 47%,工具搜索机制在保持同等准确率下大幅降本。
  • 学术与推理:
    • GPQA Diamond:92.8%(Pro 版 94.4%),科学问答接近满分。
    • Humanity’s Last Exam(带工具):52.1%(Pro 版 58.7%),高难度综合测试表现突出。
    • ARC-AGI-2:73.3%(Pro 版 83.3%),抽象推理能力大幅跃升,GPT-5.2 Pro 仅 54.2%。
  • 可靠性:
    • 单条事实错误概率:降低 33%。
    • 完整回答出错率:降低 18%,成为 OpenAI 迄今最 factual 的模型。

GPT‑5.4

如何使用GPT‑5.4

  • ChatGPT:访问 ChatGPT 官网或 ChatGPT App,GPT-5.4 已向 ChatGPT Plus、Team 和 Pro 用户开放,替代 GPT-5.2 Thinking 成为默认思考模型。。
  • OpenAI API:通过 API 密钥调用 gpt-5.4 或 gpt-5.4-pro 模型端点,支持最高 100 万 Token 上下文和工具搜索功能,按 Token 用量计费。
  • Codex:访问 Codex 官网输入 /fast 开启加速模式,或使用实验性 1M 上下文窗口处理大型代码项目,支持 Playwright Interactive 可视化调试。

GPT‑5.4的产品定价

  • ChatGPT 订阅
    • Plus/Business订阅:含 GPT-5.4 Thinking(每周3000次)。
    • Pro订阅:含 GPT-5.4 Pro(不限量)。
  • API 按量计费
    • GPT-5.4:输入 $2.50/百万Token,缓存输入 $0.25/百万Token,输出 $15/百万Token。
    • GPT-5.4 Pro:输入 $30/百万Token,输出 $180/百万Token。

GPT‑5.4的应用场景

  • 办公自动化:替代人工完成制作 PPT、财务建模、数据分析、文档处理等知识工作。
  • 智能 Agent:自主操作电脑完成跨应用任务,如自动发送邮件、填写表单、调度日程、批量数据录入。
  • 软件开发:全栈开发、代码审查、Bug 修复,支持边写边测的 Playwright 交互调试,可独立构建复杂 Web 应用和游戏。
  • 企业流程:接入内部系统实现 RPA 自动化,处理税务申报、合同审核、客户服务等长周期多步骤任务。
  • 深度研究:多轮网页搜索整合信息,处理需要跨来源验证的复杂查询。

📝 站长洞察 (Editor’s Insight)

GPT-5.4的发布标志着AI从“辅助工具”到“自主Agent”的质变。其核心突破不在于单项能力的提升,而在于实现了感知(视觉)、推理(思考)、行动(操作)的闭环整合——它能看懂界面、规划步骤并执行鼠标键盘操作,这是迈向通用人工智能(AGI)的关键一步。对行业而言,这预示着“软件即工具”将向“软件即同事”演进,企业的工作流、组织架构甚至商业模式都将面临重构。尤其值得关注的是其“实时任务调控”能力,这解决了早期AI Agent任务执行僵化的核心痛点,使其能应对真实工作场景中的不确定性。未来12-18个月,基于此类模型的垂直应用将迎来爆发,而能否构建可靠的“人机协作”流程,将成为企业新的竞争力分水岭。

DevDocs – 开源的技术文档爬取和处理工具
有道写作
FlexiAct – 清华联合腾讯推出的动作迁移模型
Salley AI职业导师
Codexia:革新AI编码体验的开源桌面神器,多会话管理与实时流式响应一网打尽
TAGGED:AI模型GPT-5.4openai人工智能办公自动化
分享
Email 复制链接 打印
Share
上一篇 蚂蚁集团发布Ming-flash-omni-2.0:开源全模态大模型,引领AI理解与生成一体化新范式
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

蚂蚁集团发布Ming-flash-omni-2.0:开源全模态大模型,引领AI理解与生成一体化新范式
AI 工具 AIGC 资讯
OpenAI发布GPT-5.3-Codex-Spark:1000+ tokens/s实时编程模型,速度提升80%的开发神器
AI 工具 AIGC 资讯
GPT-5.3 Instant深度解析:免费轻量级对话模型,幻觉率降27%全面升级
AI 工具 AIGC 资讯
GPT-5.4发布:首个超越人类的AI Agent,75%电脑操作成功率重新定义生产力
AI 工具 AIGC 资讯

相关推荐

AI 工具热门资源

八个代替 Midjourney 的最佳选择!

OZ
AIGC AI工具 Midjourney
AI 工具

TalkCody开源AI编程助手评测:50+大模型一键切换,本地隐私保护重塑开发者工作流

站外新闻
AI编程助手 开发者效率 开源工具 本地AI
AI 工具

vLLM深度解析:开源大模型推理框架,PagedAttention技术如何提升吞吐量10倍并大幅降低硬件成本

站外新闻
LLM部署 PagedAttention vLLM 大模型推理 开源框架
AI 工具

Final Touch

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.