Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: GPT‑5.4发布:OpenAI旗舰AI首次超越人类,原生操作电脑、深度工作、百万Token上下文一统
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > GPT‑5.4发布:OpenAI旗舰AI首次超越人类,原生操作电脑、深度工作、百万Token上下文一统
AI 工具AIGC 资讯

GPT‑5.4发布:OpenAI旗舰AI首次超越人类,原生操作电脑、深度工作、百万Token上下文一统

站外新闻
最近更新: 2026年6月7日 下午8:15
AI Agent GPT-5.4 openai 百万token上下文 计算机操作
SHARE

💡 站外导读:AI正在从「智能问答」工具,进化为能独立「完成工作」的数字员工。企业面临的现实痛点是:专业工作流程复杂、跨应用协作低效、海量信息处理耗时。行业大背景下,「AI Agent」(智能体)成为科技巨头竞逐的焦点,谁能让AI真正接管操作系统、理解业务场景,谁就能定义下一代生产力。OpenAI此次发布的GPT-5.4,正是这一趋势的里程碑式产品。

GPT‑5.4是什么

GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万Token上下文整合进单一模型,且未牺牲任何单项性能。在OSWorld电脑操作测试中,以75%成功率首次超越人类水平;在GDPval知识工作测试中,83%的任务达到或超过专业人士水准。GPT-5.4支持截图理解界面并执行鼠标键盘操作,可独立完成跨应用复杂任务,标志着AI从”回答问题”向”完成任务”的关键转变。

阅读目录
  • GPT‑5.4是什么
  • GPT‑5.4的主要功能
  • GPT‑5.4的性能表现
  • 如何使用GPT‑5.4
  • GPT‑5.4的产品定价
  • GPT‑5.4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GPT‑5.4

GPT‑5.4的主要功能

  • 原生计算机操作:通过截图理解界面,执行鼠标点击和键盘输入,跨应用完成复杂任务(如发邮件、填表单、操作网页),OSWorld 测试成功率 75%,首次超越人类水平。
  • 深度知识工作:支持处理 44 种职业的真实工作任务,包括制作 PPT、财务建模、数据分析、法律文档分析等,GDPval 测试 83% 达到或超过专业人士水准。
  • 高阶编程与调试:整合 GPT-5.3-Codex 能力,支持代码生成、审查和优化;新增 Playwright Interactive 实现边写代码边可视化调试,可自动测试 Web 应用。
  • 智能工具调用:引入工具搜索机制,按需查询工具定义,Token 消耗降低 47%;支持多步骤任务中灵活调用外部工具和 API。
  • 深度网页搜索:支持多轮持续搜索、筛选信息并整合结果,BrowseComp 测试达 82.7%,擅长处理” needle-in-a-haystack “类复杂查询。
  • 超长上下文处理:API 支持最高 100 万 Token 上下文,可一次性处理完整项目文档;支持高达 1024 万像素的高保真图像输入。
  • 实时任务调控:复杂任务前先展示工作计划,执行中可随时调整方向,无需重新开始。
  • 多模态视觉理解:视觉推理、文档解析和界面识别能力显著提升,支持高分辨率图像和复杂界面操作。

GPT‑5.4的性能表现

  • 知识工作:
    • GDPval 测试:83.0% 的任务达到或超过行业专家水平(GPT-5.2 仅 70.9%)。
    • 投行级表格建模:87.3%(GPT-5.2 为 68.4%)。
    • PPT 生成:人类评审68% 更偏好 GPT-5.4。
  • 计算机操作:
    • OSWorld-Verified:75.0% 成功率,首次超越人类基线 72.4%,GPT-5.2 仅 47.3%。
    • WebArena-Verified:67.3%,浏览器任务处理能力领先。
    • Online-Mind2Web:92.8%,纯截图观察即可精准操作网页。
  • 编程能力:
    • SWE-Bench Pro:57.7%,略超 GPT-5.3-Codex(56.8%),同时延迟更低、Token 效率更高。
    • Terminal-Bench 2.0:75.1%,终端任务处理表现稳健。
  • 工具与搜索:
    • BrowseComp:82.7%(Pro 版高达 89.3%),较 GPT-5.2(65.8%)提升 17 个百分点,创业界新高。
    • Toolathlon:54.6%(GPT-5.2 为 45.7%),多步骤工具调用更准确。
    • Token 消耗:降低 47%,工具搜索机制在保持同等准确率下大幅降本。
  • 学术与推理:
    • GPQA Diamond:92.8%(Pro 版 94.4%),科学问答接近满分。
    • Humanity’s Last Exam(带工具):52.1%(Pro 版 58.7%),高难度综合测试表现突出。
    • ARC-AGI-2:73.3%(Pro 版 83.3%),抽象推理能力大幅跃升,GPT-5.2 Pro 仅 54.2%。
  • 可靠性:
    • 单条事实错误概率:降低 33%。
    • 完整回答出错率:降低 18%,成为 OpenAI 迄今最 factual 的模型。

GPT‑5.4

如何使用GPT‑5.4

  • ChatGPT:访问 ChatGPT 官网或 ChatGPT App,GPT-5.4 已向 ChatGPT Plus、Team 和 Pro 用户开放,替代 GPT-5.2 Thinking 成为默认思考模型。。
  • OpenAI API:通过 API 密钥调用 gpt-5.4 或 gpt-5.4-pro 模型端点,支持最高 100 万 Token 上下文和工具搜索功能,按 Token 用量计费。
  • Codex:访问 Codex 官网输入 /fast 开启加速模式,或使用实验性 1M 上下文窗口处理大型代码项目,支持 Playwright Interactive 可视化调试。

GPT‑5.4的产品定价

  • ChatGPT 订阅
    • Plus/Business订阅:含 GPT-5.4 Thinking(每周3000次)。
    • Pro订阅:含 GPT-5.4 Pro(不限量)。
  • API 按量计费
    • GPT-5.4:输入 $2.50/百万Token,缓存输入 $0.25/百万Token,输出 $15/百万Token。
    • GPT-5.4 Pro:输入 $30/百万Token,输出 $180/百万Token。

GPT‑5.4的应用场景

  • 办公自动化:替代人工完成制作 PPT、财务建模、数据分析、文档处理等知识工作。
  • 智能 Agent:自主操作电脑完成跨应用任务,如自动发送邮件、填写表单、调度日程、批量数据录入。
  • 软件开发:全栈开发、代码审查、Bug 修复,支持边写边测的 Playwright 交互调试,可独立构建复杂 Web 应用和游戏。
  • 企业流程:接入内部系统实现 RPA 自动化,处理税务申报、合同审核、客户服务等长周期多步骤任务。
  • 深度研究:多轮网页搜索整合信息,处理需要跨来源验证的复杂查询。

📝 站长洞察 (Editor’s Insight)

GPT-5.4的发布,标志着AI竞赛正式进入「Agent原生化」深水区。其核心突破并非单项指标的提升,而是将「感知-规划-执行」全链路能力首次封装进单一模型,实现了从「工具调用」到「任务闭环」的范式转移。尤其值得注意的是其「原生计算机操作」能力,这意味着AI不再依赖预设API,而是像人类一样通过视觉界面直接操作软件,这为自动化打开了近乎无限的应用场景。结合百万Token上下文,企业级复杂流程的端到端自动化成为可能。从行业视角看,OpenAI通过整合此前分散的Codex、深度搜索等能力,构建了技术护城河。但高定价(尤其Pro版)也预示着其瞄准的是高价值专业市场,一场围绕「AI数字员工」的生态与成本之战即将拉开帷幕。

OpenAI官方命令行工具震撼发布:一键调用GPT-5.5,开发者效率革命已至
估值110亿!智能戒指龙头Oura秘密提交IPO,AI驱动预防医学赛道迎来里程碑
FrontierScience基准测试:OpenAI如何用竞赛级题目精准评估大模型科学推理能力
Robin AI
GPT-5.3-Codex-Spark:OpenAI实时编程革命,Cerebras芯片驱动1000+ tokens/s超高速编码协作
TAGGED:AI AgentGPT-5.4openai百万token上下文计算机操作
分享
Email 复制链接 打印
Share
上一篇 OpenAgents开源框架深度解析:构建下一代AI Agent协作网络,开启智能体互联网新时代
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

OpenAgents开源框架深度解析:构建下一代AI Agent协作网络,开启智能体互联网新时代
AI 工具 AIGC 资讯
xAI Imagine v0.9 发布:20秒生成6秒视频,Grok免费开放,AIGC视频创作新标杆
AI 工具 AIGC 资讯
谷歌开源Androidify:用Gemini API与Jetpack Compose构建下一代AI驱动的Android应用
AI 工具 AIGC 资讯
AI21重磅开源:Jamba Reasoning 3B,30亿参数+256K上下文,轻量级推理新标杆
AI 工具

相关推荐

AIGC 资讯

Qwen2.5-Omni – 阿里开源的端到端多模态模型

站外新闻
AI 工具

Lazy Cards

remaker
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

Spotify CEO力挺AI音乐:正版授权对抗‘AI垃圾’,重塑千亿音乐产业格局

站外新闻
AIGC AI音乐 Spotify 版权授权 环球音乐集团
AIGC 资讯

Uni-AdaFocus – 清华大学推出通用的高效视频理解框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI图像生成 AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw prompt SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 文本转语音 早报 智谱AI 月之暗面 本地AI 清华大学 生成式AI 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 隐私保护 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.