Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: OpenAI开源推理模型gpt-oss:MoE架构、单卡可跑,性能叫板闭源巨头
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > OpenAI开源推理模型gpt-oss:MoE架构、单卡可跑,性能叫板闭源巨头
AI 工具AIGC 资讯

OpenAI开源推理模型gpt-oss:MoE架构、单卡可跑,性能叫板闭源巨头

站外新闻
最近更新: 2026年6月7日 下午8:21
GPT-OSS MoE架构 openai 开源模型 推理模型
SHARE

💡 站外导读:在开源大模型竞争白热化的今天,开发者既渴望拥有强大如闭源模型的推理能力,又苦于其高不可攀的部署成本与数据隐私风险。OpenAI此次开源gpt-oss系列,直击这一核心痛点:它不仅提供了媲美自家闭源模型o3/o4-mini的性能,更通过创新的MoE架构和极致优化,让顶级模型首次能在消费级硬件上流畅运行,为本地化、私有化部署AI应用扫清了关键障碍。

gpt-oss是什么

gpt-oss 是 OpenAI 推出的开源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 两个版本。gpt-oss-120b 拥有1170亿参数,激活参数约51亿,能在单张 80GB GPU 上运行;gpt-oss-20b 拥有210亿参数,激活参数约36亿,能在 16GB 内存的消费级设备(如笔记本或手机)上运行。两者均基于 MoE 架构,支持 128k上下文长度,性能接近闭源的 o4-mini 和 o3-mini,在工具调用、少样本函数调用、链式思考推理及健康问答等方面表现出色。模型基于 Apache 2.0 许可证开源,支持免费商用,为开发者提供强大的本地推理能力。

阅读目录
  • gpt-oss是什么
  • gpt-oss的主要功能
  • gpt-oss的技术原理
  • gpt-oss的性能表现
  • gpt-oss的项目地址
  • gpt-oss的应用场景
      • 📝 站长洞察 (Editor’s Insight)

OpenAI近期发布了gpt-oss-safeguard,这是一款新型开放安全推理模型,其核心特点是允许用户自定义安全策略。该系列包含gpt-oss-safeguard-120b和gpt-oss-safeguard-20b两个版本,它们均基于gpt-oss模型进行微调,专门用于内容推理、分类与标记任务。两款模型均支持生成完整的“思维链”推理过程,并且无需重新训练即可快速适应新的规则,在应对新兴风险、复杂领域或数据样本有限的场景时展现出很强的灵活性。

gpt-oss

gpt-oss的主要功能

  • 工具调用:支持调用外部工具(如网页搜索、Python代码解释器)解决复杂问题,增强问题解决能力。
  • 链式思考:逐步分解复杂问题并逐步解决,适合多步骤推理任务。
  • 低资源需求:gpt-oss-20b 能在 16GB 内存设备上运行,适合消费级设备;gpt-oss-120b 能在 80GB GPU 上运行,适合高性能需求。
  • 快速推理:推理速度可达 40-50 tokens/s,适合需要快速响应的场景。
  • 开源权重:提供完整的模型权重和代码,支持本地微调和定制,满足特定任务需求。
  • 推理强度调节:支持低、中、高三种推理强度,能根据需求调整,平衡延迟与性能。
  • gpt-oss-safeguard:
    • 内容推理与分类:根据开发者提供的策略,对用户消息或 AI 生成内容进行推理、分类和标记。
    • 动态策略应用:在推理阶段直接解释并应用开发者自定义的安全策略,无需在训练阶段硬编码规则,能够快速适应新规则。
    • 完整“思维链”输出:展示模型得出结论的每一步推理过程,提升透明度和可用性,方便开发者追溯和理解模型的判断逻辑。

gpt-oss的技术原理

  • 模型架构:基于 Transformer 架构,用专家混合(MoE)技术减少处理输入所需的活跃参数数量,提高推理效率。基于交替的密集和局部带状稀疏注意力模式,类似于 GPT-3,进一步优化内存和计算效率。用分组多查询注意力机制,分组大小为 8,进一步提升推理效率。用 RoPE 进行位置编码,支持最长 128k 的上下文长度。
  • 预训练与后训练:预训练用高质量的纯文本数据集进行预训练,重点关注 STEM、编程和通用知识领域。后训练用与 o4-mini 类似的训练流程,包括监督式微调和高计算量的强化学习阶段。训练目标是让模型符合 OpenAI 模型规范,具备链式推理和工具调用能力。
  • 量化与优化:用 MXFP4 格式进行量化,模型在训练阶段就适应低精度环境,确保在减少模型体积的同时保持高性能。gpt-oss-20b量化后模型大小约为 12.8GB,能在 16GB 内存设备上运行。gpt-oss-120b量化后可在 80GB 内存中运行。与 NVIDIA、AMD 等硬件厂商合作,确保模型在各类系统上实现性能优化。
  • 安全机制:在预训练阶段过滤与化学、生物、放射性和核(CBRN)相关的有害数据。通过审慎对齐和指令优先级评估,训练模型拒绝不安全提示并抵御注入攻击。在特定领域(如生物学和网络安全)进行对抗性微调,评估并优化模型的安全性。

gpt-oss的性能表现

  • 基准测试表现:
    • 竞赛编程:在 Codeforces 竞赛编程测试中,gpt-oss-120b 获得 2622 分,gpt-oss-20b 获得 2516 分,表现优于部分开源模型,略逊于闭源的 o3 和 o4-mini。
    • 通用问题解决:在 MMLU 和 HLE 测试中,gpt-oss-120b 表现优于 OpenAI 的 o3-mini,并接近 o4-mini 的水平。
    • 工具调用:在 TauBench 智能体评估套件中,gpt-oss-120b 和 gpt-oss-20b 的表现均优于 OpenAI 的 o3-mini,达到或超过了 o4-mini 的水平。
    • 健康问答:在 HealthBench 测试中,gpt-oss-120b 的表现超越 o4-mini, gpt-oss-20b 达到与 o3-mini 相当的水平。

gpt-oss

gpt-oss的项目地址

gpt-oss:

  • 项目官网:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
  • GitHub仓库:https://github.com/openai/gpt-oss
  • HuggingFace模型库:https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4
  • 在线体验Demo:https://gpt-oss.com/

gpt-oss-safeguard:

  • 项目官网:https://openai.com/index/introducing-gpt-oss-safeguard/
  • HuggingFace模型库:https://huggingface.co/collections/openai/gpt-oss-safeguard
  • 技术论文:https://openai.com/index/gpt-oss-safeguard-technical-report/

gpt-oss的应用场景

  • 本地推理与隐私保护:在隐私敏感领域(如医疗、金融),gpt-oss 能在本地设备运行,确保数据安全,同时提供强大推理能力。
  • 编程辅助与代码生成:开发者用 gpt-oss 调用工具生成和验证代码片段,显著提升编程效率,减少调试时间。
  • 智能客服与客户支持:企业部署 gpt-oss 作为智能客服,快速响应客户咨询,提供准确答案,降低人力成本。
  • 教育与学习辅导:学生借助 gpt-oss 辅助学习,解答问题、提供写作建议,提升学习效率和理解能力。
  • 创意内容生成:作家、编剧、游戏开发者等用 gpt-oss 生成创意内容,激发灵感,提升创作效率。

📝 站长洞察 (Editor’s Insight)

OpenAI开源gpt-oss,绝非简单的技术分享,而是一次精妙的战略卡位。它标志着顶级AI能力从“云端专享”向“本地普惠”的关键转折。其MoE架构与量化技术的结合,巧妙解决了“性能-成本-隐私”的不可能三角,为边缘计算、企业私有化部署打开了全新想象空间。这不仅是技术范式革新,更是对开源生态的一次强力注入,将迫使整个行业重新评估模型部署策略。同时,gpt-oss-safeguard的发布,预示着OpenAI正试图构建从模型到安全治理的全栈开源标准,其背后的生态野心与商业布局,远比模型本身更值得关注。

Ethnic Influences in Asian Human relationships
DITTO-2 – Adobe 联合加大推出的音乐生成模型
Adaptiv Academy
InputAI
OpenDeepSearch – AI搜索工具,支持深度网络搜索和信息检索
TAGGED:GPT-OSSMoE架构openai开源模型推理模型
分享
Email 复制链接 打印
Share
上一篇 谷歌DeepMind发布Genie 3:可实时生成动态虚拟世界,AI世界模型迎来新突破
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

谷歌DeepMind发布Genie 3:可实时生成动态虚拟世界,AI世界模型迎来新突破
AI 工具 AIGC 资讯
Claude Opus 4.1 深度评测:74.5% SWE-bench 登顶!编程、Agent与安全性全面超越GPT-4.1
AI 工具 AIGC 资讯
Lumina AI开源Chunkr:一键将PDF/PPT转为RAG结构化数据的终极文档处理API
AI 工具
小红书Hi Lab重磅开源dots.vlm1:12亿参数视觉编码器+DeepSeek V3,多模态大模型性能直逼闭源SOTA
AI 工具 AIGC 资讯

相关推荐

AI 工具

Radaar AI Post Generator

remaker
AI 工具

AIChatting聊天机器人

remaker
AIGC 资讯

X-Dyna – 字节联合斯坦福等高校推出的动画生成框架

站外新闻
AIGC 资讯

NodeRAG – 开源基于异构图的智能检索与生成系统

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 openai prompt RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大模型推理 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 端侧部署 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 边缘计算 通义千问 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.