Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Skywork-OR1 – 昆仑万维开源的高性能系列推理模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Skywork-OR1 – 昆仑万维开源的高性能系列推理模型
AIGC 资讯

Skywork-OR1 – 昆仑万维开源的高性能系列推理模型

站外新闻
最近更新: 2026年6月8日 上午5:51
SHARE

Skywork-OR1是什么

Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型,Skywork-OR1-Math-7B是数学推理模型,具备强大的数学解题能力;Skywork-OR1-7B-Preview是通用模型,兼具数学和代码能力;Skywork-OR1-32B-Preview是旗舰版本,适合更高复杂度的任务,推理能力更强。在性能方面,Skywork-OR1系列在多个基准测试中表现出色。例如,在AIME24和AIME25数学数据集上,Skywork-OR1-Math-7B分别取得了69.8%和52.3%的高分,远超同规模的主流模型。在竞赛编程任务中,Skywork-OR1-32B-Preview在LiveCodeBench数据集上的表现接近DeepSeek-R1(671B参数),展现卓越的性价比。

阅读目录
  • Skywork-OR1是什么
  • Skywork-OR1的主要功能
  • Skywork-OR1的技术原理
  • Skywork-OR1的性能表现
  • Skywork-OR1的项目地址
  • Skywork-OR1的应用场景
Skywork-OR1

Skywork-OR1的主要功能

  • 逻辑推理能力:具备强大的逻辑推理能力,处理复杂的逻辑关系和多步骤推理任务。
  • 编程任务支持:支持生成高质量的代码,支持多种编程语言。
  • 代码优化与调试:对代码进行优化和调试,提高代码的可读性和执行效率。
  • 多领域任务适应:具备通用推理能力,支持处理其他领域的复杂任务。
  • 多轮对话与交互:支持多轮对话,根据上下文信息逐步解决问题,提供更连贯的推理过程。

Skywork-OR1的技术原理

  • 高质量数据集:基于高质量的数学数据集,如NuminaMath-1.5(约89.6万题),筛选出AIME、Olympiads等高难度子集,总计约11万道数学题目。LeetCode和TACO数据为主,经过严格筛选和去重,保留单元测试完整、验证通过的问题,获得13.7K条高质量代码问题。
  • 数据预处理与过滤:每道题进行多轮采样验证答案,剔除“全对”或“全错”的题目,避免无效数据对训练的影响。结合人类评审和LLM自动判题机制,清理语义不清、信息不全、格式错误或含有无关内容的题目。
  • 训练策略:基于GRPO进行模型训练,多阶段训练逐步增加上下文窗口长度,提升模型的长链思维能力。在训练前和训练过程中分别进行离线和在线过滤,动态剔除无效样本,确保训练数据的有效性和挑战性。在强化学习采样时用高采样温度(τ=1.0),基于自适应熵控制机制,增强模型的探索能力,避免过早陷入局部最优。
  • 损失函数优化:在训练中移除KL损失项,让模型充分地探索和优化推理能力。将策略损失在训练批次内的所有token上进行平均,提升优化过程的一致性与稳定性。
  • 多阶段训练:基于多阶段训练逐步扩展上下文窗口长度,让模型在有限token内高效完成任务,逐步掌握复杂的长链思维能力。在多阶段训练初期,基于特定策略处理截断样本,确保模型在进入下一阶段时迅速提升性能。

Skywork-OR1的性能表现

  • 数学推理任务:
    • 通用模型Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview在AIME24与AIME25数据集上实现同参数规模最优表现,展现强大数学推理能力。
    • 专项模型Skywork-OR1-Math-7B在AIME24和AIME25上分别取得69.8与52.3的高分,远超当前主流7B级别模型,凸显高阶数学推理专业优势。
    • Skywork-OR1-32B-Preview在所有benchmark上超越QwQ-32B,在AIME25上基本与R1持平。
  • 竞赛编程任务:
    • 通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上取得同等参数规模最优性能。
    • Skywork-OR1-32B-Preview代码生成与问题求解能力接近DeepSeek-R1(参数规模671B),在压缩模型体量的同时实现卓越性价比,体现训练策略先进性。
  • Skywork-OR1-Math-7B表现:
    • 在AIME24上训练准确率曲线显示性能稳定提升,模型在AIME24和AIME25上分别达到69.8%和52.3%,超越OpenAI-o3-mini (low),达当前尺寸SOTA性能。
    • 在Livecodebench上从37.6%提升到43.6%,相比基线模型显著提升,显示训练方法领域泛化性好。

Skywork-OR1的项目地址

  • 项目官网:https://capricious-hydrogen-41c.notion.site/Skywork-Open-Reasoner
  • GitHub仓库:https://github.com/SkyworkAI/Skywork-OR1
  • HuggingFace模型库:https://huggingface.co/collections/Skywork/skywork-or1

Skywork-OR1的应用场景

  • 数学教育:辅助学生解题,提供思路与步骤,助力教师备课。
  • 科研辅助:帮助研究人员探索复杂模型,验证猜想,推导公式。
  • 编程开发:生成代码框架,优化代码,辅助调试,提升开发效率。
  • 数据分析:支持金融、商业等领域决策,预测趋势,评估风险。
  • AI研究:作为研究平台,推动推理模型架构和算法的改进。
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
智谱AI发布SCAIL:影视级角色动画生成框架,一键实现多人复杂交互与照片驱动动画
GPT-5.1-Codex-Max:突破百万Token上下文,OpenAI发布重构级AI编程模型
Oculus创始人AI新作Sesame上线:重新定义‘边想边说’的流畅对话体验
Llama Nemotron – 英伟达推出的系列推理模型
分享
Email 复制链接 打印
Share
上一篇 Agent TARS – 字节跳动开源的多模态 AI Agent 项目
下一篇 ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯
联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

告别低效教学!知达 AI 用全闭环智能工具重构教育生产力

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

OpenAI CEO 萨姆・奥特曼:积极主动的 AI 将成为未来趋势

站外新闻
AIGC 资讯

Qwen-VLA – 阿里通义推出的通用视觉-语言-动作模型

站外新闻
AIGC 资讯

PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.