Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 昆仑万维开源Skywork-SWE-32B:32B参数量刷新SWE-bench记录,代码智能体基座模型迎来新突破
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 昆仑万维开源Skywork-SWE-32B:32B参数量刷新SWE-bench记录,代码智能体基座模型迎来新突破
AI 工具AIGC 资讯

昆仑万维开源Skywork-SWE-32B:32B参数量刷新SWE-bench记录,代码智能体基座模型迎来新突破

站外新闻
最近更新: 2026年6月7日 下午8:26
Skywork-SWE-32B 代码智能体 大模型开源 昆仑万维 软件工程
SHARE

💡 站外导读:在AI编程助手日益普及的今天,如何让模型真正解决复杂、真实的软件工程问题,而非仅限于代码片段补全,成为行业核心挑战。仓库级代码修复涉及长上下文理解、多轮交互与环境验证,对模型能力要求极高。昆仑万维此次开源的Skywork-SWE-32B模型,正瞄准这一痛点,通过构建超大规模可验证数据集与创新训练推理技术,旨在推动开源代码智能体迈向实用化新阶段。

Skywork-SWE-32B是什么

Skywork-SWE-32B是昆仑万维开源的32B规模的软件工程(SWE)自主代码智能体基座模型。模型专注于软件工程任务,特别是仓库级代码修复能力,能在多轮交互和长文本处理的复杂场景中表现出色。通过构建超过1万个可验证的GitHub仓库任务实例,打造了目前最大规模的可验证GitHub仓库级代码修复的数据集,在SWE-bench Verified基准测试中取得了38.0%的pass@1准确率,刷新了同参数规模模型的最佳成绩。引入测试时扩展技术后,准确率进一步提升至47.0%,显著超越了现有32B以下的开源模型,接近甚至超越部分闭源模型的性能。

阅读目录
  • Skywork-SWE-32B是什么
  • Skywork-SWE-32B的主要功能
  • Skywork-SWE-32B的技术原理
  • Skywork-SWE-32B的项目地址
  • Skywork-SWE-32B的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Skywork-SWE-32B

Skywork-SWE-32B的主要功能

  • 仓库级代码修复:能定位GitHub仓库中的代码问题(如Bug),生成修复代码,验证修复效果,完成从问题理解到解决的全流程闭环。
  • 多轮交互能力:支持超过50轮的交互,模拟真实开发场景中的多次调试与修复过程,逐步解决问题。
  • 长文本处理:能处理超过32k tokens的长文本,满足复杂代码文件和多文件依赖的处理需求。
  • 自动化验证:通过构建专用的运行时环境和单元测试验证机制,确保生成的修复代码在实际运行环境中有效。

Skywork-SWE-32B的技术原理

  • 大规模数据集构建
    • 自动化数据收集与验证:通过三阶段的自动化流程(数据采集与预筛选、基于执行的验证、智能体轨迹生成),构建了包含10,169个真实Python任务实例的数据集,覆盖2,531个不同的GitHub仓库。
    • 运行时环境支持:每个任务实例都配备了专用的Docker运行时环境镜像,支持自动化单元测试验证,确保生成的修复代码在实际运行环境中有效。
    • 高质量训练轨迹:通过智能体在任务求解过程中的多轮交互轨迹,生成高质量的训练样本,用于模型的微调。
  • 模型训练与优化
    • 基于OpenHands框架:采用OpenHands代码智能体框架,支持多轮交互和长文本处理,能模拟真实开发场景中的代码修复过程。
    • 数据缩放定律:通过系统性验证,发现随着训练数据规模的增加,模型性能持续提升,验证了数据缩放定律在软件工程任务中的适用性。
    • 测试时扩展技术(TTS):在推理阶段,通过增加独立rollout的数量(如N=8),进一步提升模型的性能,充分利用模型的推理能力。

Skywork-SWE-32B的项目地址

  • HuggingFace模型库:https://huggingface.co/Skywork/Skywork-SWE-32B
  • 技术论文:https://huggingface.co/Skywork/Skywork-SWE-32B/resolve/main/assets/Report.pdf

Skywork-SWE-32B的应用场景

  • 优化代码质量:模型可以分析代码中的潜在问题,提出优化建议,帮助开发者提高代码质量和可维护性。
  • 单元测试自动化:通过构建专用的运行时环境和单元测试验证机制,Skywork-SWE-32B能自动化执行测试用例,验证生成的修复代码是否有效。
  • 教学辅助:在软件工程和编程课程中,Skywork-SWE-32B可以作为教学工具,帮助学生理解代码问题的解决过程,提高编程能力。
  • 研究支持:为研究人员提供了强大的实验平台,用于探索大语言模型在软件工程任务中的应用,验证数据缩放定律等理论。
  • 内部开发工具:企业可以将Skywork-SWE-32B集成到内部开发工具中,自动化处理代码问题,减少人工干预,提高开发效率和代码质量。

📝 站长洞察 (Editor’s Insight)

Skywork-SWE-32B的发布,标志着开源社区在专用代码智能体领域取得了实质性进展。其核心价值不仅在于刷新了SWE-bench Verified基准,更在于它揭示了一条清晰的路径:通过构建大规模、高质量、可验证的专用数据集(如其万级GitHub仓库实例),并结合数据缩放定律与测试时扩展技术(TTS),能让中等规模的开源模型在复杂软件工程任务上逼近甚至挑战顶级闭源模型。这预示着‘数据驱动’与‘推理增强’双轮驱动将成为未来代码大模型发展的关键范式。对于企业而言,此类模型集成到内部开发流程,有望在代码审查、缺陷修复、测试用例生成等环节实现效率跃升,降低对昂贵闭源API的依赖。开源生态的壮大,将持续推动AI编程从辅助‘补全’向自主‘求解’进化。

司农:南京农业大学开源农业大模型,40亿token数据驱动,赋能智慧农业全场景
警报:微软Copilot惊现‘幽灵周报’漏洞!AI助手竟成企业数据‘内鬼’
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
AI Lawyer
Scribe
TAGGED:Skywork-SWE-32B代码智能体大模型开源昆仑万维软件工程
分享
Email 复制链接 打印
Share
上一篇 中科院Stream-Omni重磅发布:GPT-4o级多模态大模型,实现语音、视觉、文本无缝交互
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

中科院Stream-Omni重磅发布:GPT-4o级多模态大模型,实现语音、视觉、文本无缝交互
AI 工具 AIGC 资讯
香港大学开源RAG-Anything:革命性多模态RAG系统,一键处理图文表格复杂文档
AI 工具 AIGC 资讯
微软重磅发布Deep Video Discovery:AI智能体如何革新长视频分析?
AI 工具 AIGC 资讯
Time-R1: 3B参数小模型登顶时间推理,三阶段强化学习如何击败671B巨无霸?
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

京东开源JoyAgent-JDGenie:GAIA榜单准确率75.15%的轻量化通用多智能体系统,开箱即用

站外新闻
AI Agent GAIA榜单 京东开源 企业级AI应用 多智能体系统
AI 工具AIGC 资讯

Kyutai TTS:220ms超低延迟流式语音合成,10秒声音克隆重塑实时交互

站外新闻
AI语音合成 Kyutai Labs 低延迟TTS 声音克隆 流式文本转语音
AIGC 资讯

Sky-T1 – NovaSky 开源的推理 AI 模型,可从零开始复现该模型

站外新闻
AIGC 资讯

R1-Omni – 阿里通义开源的全模态大语言模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.