Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: GPT-5.4重磅发布:OpenAI旗舰AI模型集成电脑操作与深度搜索,专业工作性能首超人类
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > GPT-5.4重磅发布:OpenAI旗舰AI模型集成电脑操作与深度搜索,专业工作性能首超人类
AI 工具AIGC 资讯

GPT-5.4重磅发布:OpenAI旗舰AI模型集成电脑操作与深度搜索,专业工作性能首超人类

站外新闻
最近更新: 2026年6月7日 下午8:24
AI Agent GPT-5.4 openai 计算机操作
SHARE

💡 站外导读:在AI从“聊天工具”向“生产力引擎”转型的关键节点,OpenAI发布了GPT-5.4,一个旨在彻底重塑专业工作流程的旗舰模型。面对企业日益复杂的知识处理、跨应用协作与海量数据分析需求,现有AI工具往往“偏科”严重。GPT-5.4的核心突破在于,首次将顶尖的推理能力、编程能力、原生计算机操控能力、深度信息搜索与百万级超长上下文处理融为一体,且在各项基准测试中均达到或超越人类专家水平。这不仅标志着AI技术栈的深度整合,更预示着“AI同事”时代正加速到来,专业工作的自动化边界被推向全新高度。

GPT‑5.4是什么

GPT-5.4是OpenAI推出的旗舰AI模型,定位为”专为专业工作设计的最强前沿模型”。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万Token上下文整合进单一模型,且未牺牲任何单项性能。在OSWorld电脑操作测试中,以75%成功率首次超越人类水平;在GDPval知识工作测试中,83%的任务达到或超过专业人士水准。GPT-5.4支持截图理解界面并执行鼠标键盘操作,可独立完成跨应用复杂任务,标志着AI从”回答问题”向”完成任务”的关键转变。

阅读目录
  • GPT‑5.4是什么
  • GPT‑5.4的主要功能
  • GPT‑5.4的性能表现
  • 如何使用GPT‑5.4
  • GPT‑5.4的产品定价
  • GPT‑5.4的应用场景
      • 📝 站长洞察 (Editor’s Insight)

GPT‑5.4

GPT‑5.4的主要功能

  • 原生计算机操作:通过截图理解界面,执行鼠标点击和键盘输入,跨应用完成复杂任务(如发邮件、填表单、操作网页),OSWorld 测试成功率 75%,首次超越人类水平。
  • 深度知识工作:支持处理 44 种职业的真实工作任务,包括制作 PPT、财务建模、数据分析、法律文档分析等,GDPval 测试 83% 达到或超过专业人士水准。
  • 高阶编程与调试:整合 GPT-5.3-Codex 能力,支持代码生成、审查和优化;新增 Playwright Interactive 实现边写代码边可视化调试,可自动测试 Web 应用。
  • 智能工具调用:引入工具搜索机制,按需查询工具定义,Token 消耗降低 47%;支持多步骤任务中灵活调用外部工具和 API。
  • 深度网页搜索:支持多轮持续搜索、筛选信息并整合结果,BrowseComp 测试达 82.7%,擅长处理” needle-in-a-haystack “类复杂查询。
  • 超长上下文处理:API 支持最高 100 万 Token 上下文,可一次性处理完整项目文档;支持高达 1024 万像素的高保真图像输入。
  • 实时任务调控:复杂任务前先展示工作计划,执行中可随时调整方向,无需重新开始。
  • 多模态视觉理解:视觉推理、文档解析和界面识别能力显著提升,支持高分辨率图像和复杂界面操作。

GPT‑5.4的性能表现

  • 知识工作:
    • GDPval 测试:83.0% 的任务达到或超过行业专家水平(GPT-5.2 仅 70.9%)。
    • 投行级表格建模:87.3%(GPT-5.2 为 68.4%)。
    • PPT 生成:人类评审68% 更偏好 GPT-5.4。
  • 计算机操作:
    • OSWorld-Verified:75.0% 成功率,首次超越人类基线 72.4%,GPT-5.2 仅 47.3%。
    • WebArena-Verified:67.3%,浏览器任务处理能力领先。
    • Online-Mind2Web:92.8%,纯截图观察即可精准操作网页。
  • 编程能力:
    • SWE-Bench Pro:57.7%,略超 GPT-5.3-Codex(56.8%),同时延迟更低、Token 效率更高。
    • Terminal-Bench 2.0:75.1%,终端任务处理表现稳健。
  • 工具与搜索:
    • BrowseComp:82.7%(Pro 版高达 89.3%),较 GPT-5.2(65.8%)提升 17 个百分点,创业界新高。
    • Toolathlon:54.6%(GPT-5.2 为 45.7%),多步骤工具调用更准确。
    • Token 消耗:降低 47%,工具搜索机制在保持同等准确率下大幅降本。
  • 学术与推理:
    • GPQA Diamond:92.8%(Pro 版 94.4%),科学问答接近满分。
    • Humanity’s Last Exam(带工具):52.1%(Pro 版 58.7%),高难度综合测试表现突出。
    • ARC-AGI-2:73.3%(Pro 版 83.3%),抽象推理能力大幅跃升,GPT-5.2 Pro 仅 54.2%。
  • 可靠性:
    • 单条事实错误概率:降低 33%。
    • 完整回答出错率:降低 18%,成为 OpenAI 迄今最 factual 的模型。

GPT‑5.4

如何使用GPT‑5.4

  • ChatGPT:访问 ChatGPT 官网或 ChatGPT App,GPT-5.4 已向 ChatGPT Plus、Team 和 Pro 用户开放,替代 GPT-5.2 Thinking 成为默认思考模型。。
  • OpenAI API:通过 API 密钥调用 gpt-5.4 或 gpt-5.4-pro 模型端点,支持最高 100 万 Token 上下文和工具搜索功能,按 Token 用量计费。
  • Codex:访问 Codex 官网输入 /fast 开启加速模式,或使用实验性 1M 上下文窗口处理大型代码项目,支持 Playwright Interactive 可视化调试。

GPT‑5.4的产品定价

  • ChatGPT 订阅
    • Plus/Business订阅:含 GPT-5.4 Thinking(每周3000次)。
    • Pro订阅:含 GPT-5.4 Pro(不限量)。
  • API 按量计费
    • GPT-5.4:输入 $2.50/百万Token,缓存输入 $0.25/百万Token,输出 $15/百万Token。
    • GPT-5.4 Pro:输入 $30/百万Token,输出 $180/百万Token。

GPT‑5.4的应用场景

  • 办公自动化:替代人工完成制作 PPT、财务建模、数据分析、文档处理等知识工作。
  • 智能 Agent:自主操作电脑完成跨应用任务,如自动发送邮件、填写表单、调度日程、批量数据录入。
  • 软件开发:全栈开发、代码审查、Bug 修复,支持边写边测的 Playwright 交互调试,可独立构建复杂 Web 应用和游戏。
  • 企业流程:接入内部系统实现 RPA 自动化,处理税务申报、合同审核、客户服务等长周期多步骤任务。
  • 深度研究:多轮网页搜索整合信息,处理需要跨来源验证的复杂查询。

📝 站长洞察 (Editor’s Insight)

GPT-5.4的发布,绝非一次简单的模型迭代,而是OpenAI对AI生产力范式的一次重新定义。其核心战略意义在于“能力整合”与“闭环执行”。过去,我们需要分别调用编程模型、浏览器插件和文档助手;而GPT-5.4将这些能力原生集成,形成了从“理解需求”到“规划任务”,再到“操作电脑执行”的完整闭环。这直接指向了AI发展的下一阶段:**自主Agent**。它不再是被动回答问题的“顾问”,而是能主动操作数字世界的“员工”。OSWorld测试首超人类,更是将“AI替代论”从理论推演拉入了可量化的现实。对企业而言,这意味着RPA(机器人流程自动化)的智能化跃迁;对开发者,它是一个能“边写边测”的超级编程伙伴。然而,这也对企业的数据安全、工作流重构提出了更高要求。GPT-5.4像一把钥匙,打开了“AI原生工作流程”的大门,如何设计与之匹配的人机协作机制,将成为下一阶段的竞争焦点。

百度PP-OCRv5发布:0.07亿参数,40+语言识别,CPU每秒处理370+字符的轻量级OCR模型
谢赛宁团队开源Solaris:首个多人视频世界生成模型,突破AI世界模拟新边界
DICE-Talk – 复旦联合腾讯优图推出的情感化动态肖像生成框架
ConceptMaster – 高保真多概念视频定制生成的创新 AI 框架
告别Excel安装烦恼!AI Agent通过Excel MCP Server实现自动化数据处理新范式
TAGGED:AI AgentGPT-5.4openai计算机操作
分享
Email 复制链接 打印
Share
上一篇 FairyGen:大湾区大学AI框架,从单张草图生成风格一致、叙事连贯的动画故事视频
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

FairyGen:大湾区大学AI框架,从单张草图生成风格一致、叙事连贯的动画故事视频
AI 工具 AIGC 资讯
OmniGen2开源多模态生成模型:文本生图、图像编辑全能,智源研究院引领AIGC新范式
AI 工具 AIGC 资讯
阿里通义Qwen-TTS语音合成模型发布:支持中英文、方言与流式输出,助力智能交互新时代
AI 工具 AIGC 资讯
Speakr:本地化AI会议助手,免费开源,100%数据私密,会议录音秒变纪要
AI 工具 AIGC 资讯

相关推荐

AI 工具

Octofriend:开源AI编程助手,自由切换GPT-5/Claude等大模型,代码自动修复与隐私零追踪

站外新闻
AI编程助手 代码自动修复 大型语言模型 开源工具 零数据追踪
AIGC 资讯

VideoAnydoor – 港大联合阿里达摩院等机构推出的零样本视频对象插入框架

站外新闻
AI 工具AIGC 资讯

阶跃星辰开源 Step 3.7 Flash:196B参数MoE架构,400 Tokens/s极速推理,专为智能体生产落地优化

站外新闻
MoE架构 多模态 阶跃星辰
AI 工具AIGC 资讯

Step Image Edit 2:3.5B参数轻量模型如何秒杀20B级开源大模型?阶跃星辰发布新一代图像编辑模型

站外新闻
AIGC 图像生成模型 图像编辑 轻量级大模型 阶跃星辰
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.