Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型
AIGC 资讯

DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型

站外新闻
最近更新: 2026年6月8日 下午7:21
SHARE

DeepCoder-14B-Preview是什么

DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。DeepCoder-14B-Preview基于分布式强化学习(RL)训练,在代码生成任务上表现出色,特别是在 LiveCodeBench 上达到 60.6% 的准确率,与 OpenAI 的 o3-mini 相当。模型开源了训练数据集、代码、训练日志和系统优化,推动强化学习(RL)在大型语言模型(LLM)中的应用,降低 RL 训练的门槛,促进社区发展。

阅读目录
  • DeepCoder-14B-Preview是什么
  • DeepCoder-14B-Preview的主要功能
  • DeepCoder-14B-Preview的技术原理
  • DeepCoder-14B-Preview的项目地址
  • DeepCoder-14B-Preview的应用场景

DeepCoder-14B-Preview

DeepCoder-14B-Preview的主要功能

  • 高质量代码生成:生成高质量、可运行的代码,适用于多种编程语言和场景。
  • 代码问题解决:解决复杂的编程问题,包括算法设计、数据结构优化等。
  • 代码补全与优化:提供代码补全功能,帮助开发者快速完成代码编写,优化现有代码提高效率。
  • 单元测试生成:自动生成单元测试代码,确保生成代码的准确性和可靠性。
  • 代码调试辅助:帮助开发者定位和修复代码中的错误,提高开发效率。
  • 跨平台适用性:支持多种编程环境和平台,具有广泛的适用性。

DeepCoder-14B-Preview的技术原理

  • 基础模型:基于 Deepseek-R1-Distilled-Qwen-14B,一个经过蒸馏优化的 140 亿参数的预训练模型,具备强大的语言理解和生成能力。
  • 强化学习微调:基于分布式强化学习(RL)对基础模型进行微调。强化学习基于奖励机制引导模型生成更高质量的代码,确保代码的准确性和效率。
  • 高质量数据集:用经过严格筛选的 24K 个可验证编程问题进行训练,数据来源包括 TACO Verified、PrimeIntellect 的 SYNTHETIC-1 数据集及 LiveCodeBench 提交的问题。
  • 奖励函数设计:基于稀疏结果奖励模型(ORM),只有当生成的代码用所有采样单元测试时才给予奖励,避免模型用记忆测试用例获取奖励。
  • 上下文扩展技术:迭代上下文扩展技术,模型从较短的上下文长度开始学习,逐步泛化到更长的上下文,最终在 64K 上下文中达到 60.6% 的准确率。
  • 系统优化:引入 verl-pipeline,基于流水线技术加速训练过程,减少训练时间,提高训练效率。

DeepCoder-14B-Preview的项目地址

  • 项目官网:https://pretty-radio-b75.notion.site/DeepCoder-A-Fully-Open-Source-14B-Coder
  • HuggingFace模型库:https://huggingface.co/agentica-org/DeepCoder-14B-Preview

DeepCoder-14B-Preview的应用场景

  • 代码生成与自动化编程:快速生成高质量代码,减少手动编写代码的时间和工作量,提高开发效率。适用于各种编程语言和框架,帮助开发者快速启动项目。
  • 算法竞赛与问题解决:在算法竞赛(如 Codeforces)中,帮助参赛者快速理解问题并生成高效的解决方案,提升竞赛表现。
  • 代码优化与重构:对现有代码进行优化和重构,提高代码的可读性、性能和可维护性。帮助开发者识别和修复潜在的代码问题。
  • 教育与学习辅助:作为编程教育工具,帮助学生理解和实践编程概念,提供代码示例和解决方案,辅助学习编程语言和算法。
  • 软件开发与测试:生成单元测试代码,确保软件质量;辅助开发过程中的代码调试,帮助开发者快速定位和解决问题,提升软件开发的整体效率。
重磅!AI编程独角兽Cognition估值250亿美元,10亿融资背后揭示了哪些行业颠覆信号?
​加大学开启 AI 实验:50 万师生与 ChatGPT 共探未来教育
Yuxi-Know – 基于大模型 RAG 知识库的 AI 知识图谱问答平台
福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型
Pippo – Meta 推出的单图生成多视角高清人像视频模型
分享
Email 复制链接 打印
Share
上一篇 MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型
下一篇 Agno – 用于构建多模态智能体的轻量级框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Agno – 用于构建多模态智能体的轻量级框架
AIGC 资讯
MiniMind – 开源的AI模型训练工具,2小时训练25.8M小模型
AIGC 资讯
Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练
AIGC 资讯
3DIS-FLUX – 浙大联合哈佛推出的多实例生成框架
AIGC 资讯

相关推荐

AIGC 资讯

BiliNote – 开源 AI 视频笔记工具,自动提取视频内容生成Markdown格式

站外新闻
AIGC 资讯

Qwen2.5-VL-32B – 阿里开源的最新多模态模型

站外新闻
AI 工具AIGC 资讯

极佳视界GigaWorld-1开源具身世界模型登顶全球第一:详解架构、性能与应用场景

站外新闻
AC-WM架构 GigaWorld-1 世界模型 具身智能 机器人仿真
AIGC 资讯

Paper2Code – AI论文自动转为代码的多智能体框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.