Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Light-R1 – 360智脑开源的长思维链推理模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Light-R1 – 360智脑开源的长思维链推理模型
AIGC 资讯

Light-R1 – 360智脑开源的长思维链推理模型

站外新闻
最近更新: 2026年6月8日 上午7:19
SHARE

Light-R1是什么

Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两阶段课程学习(SFT+DPO)训练,实现从零超越DeepSeek-R1-Distill-Qwen-32B的性能。在AIME24测试中,Light-R1取得76.6分,显著高于DeepSeek-R1-Distill的72.6分。模型训练成本低,仅需12台H800机器运行6小时,成本约1000美元。模型支持全量开源,包括模型、数据集、训练框架和评测代码,推动开源社区发展,为低成本训练领域专精模型提供参考。

阅读目录
  • Light-R1是什么
  • Light-R1的主要功能
  • Light-R1的技术原理
  • Light-R1的项目地址
  • Light-R1的应用场景

Light-R1

Light-R1的主要功能

  • 高效数学问题解决:能快速、准确地解决复杂的数学问题,包括但不限于代数、几何、概率等领域。
  • 推理能力提升:具备较强的逻辑推理能力,支持处理长思维链问题。
  • 泛化能力:在其他领域(如逻辑推理、语言理解)表现出泛化能力。
  • 低成本训练与部署:极低的成本实现高性能,适合资源有限的用户或企业快速部署和应用。

Light-R1的技术原理

  • 基础模型与起点:模型基于 Qwen2.5-32B-Instruct 开发,实现从零到超越 DeepSeek-R1-Distill 的性能提升。
  • 课程学习:
    • SFT(Supervised Fine-Tuning):筛选难度分级的数据,分两阶段进行有监督的微调。第一阶段用 7 万条数据,第二阶段筛选出难度最高的 3 千条数据进一步微调。
    • DPO(Direct Preference Optimization):在 SFT 的基础上,基于多次采样和偏好对的构建,优化模型的输出质量。
  • 数据处理与去重:训练数据来自多个开源数学数据集(如 OpenR1-Math-220k、OpenThoughts-114k 等),经过严格的数据去重处理,避免测试数据泄露对模型性能的影响。
  • 模型融合:最终的 Light-R1-32B 是融合 SFT 阶段 2、DPO 和另一个 DPO 版本的模型得到的。进一步提升模型的性能和稳定性。
  • 训练框架与优化:用 360-LLaMA-Factory 训练框架,支持序列并行和高效的分布式训练。基于优化训练流程,Light-R1 在 12 台 H800 机器上仅需 6 小时即可完成训练。

Light-R1的项目地址

  • GitHub仓库:https://github.com/Qihoo360/Light-R1
  • HuggingFace模型库:https://huggingface.co/collections/qihoo360/light-r1

Light-R1的应用场景

  • 教育领域:作为数学学习工具,帮助学生解决复杂问题,提供解题步骤和思路,适用于数学竞赛和日常学习。
  • 科研与学术:辅助数学研究和跨学科问题解决,例如物理建模、工程优化等。
  • 企业应用:用于数据分析、风险评估、供应链优化等复杂问题的解决。
  • 软件集成:集成到智能助手、数学软件中,增强推理和解题功能。
  • 开源与开发者:支持开发者定制和扩展模型,推动开源社区发展。
LaDeCo – 西安交大联合微软推出的自动图形设计构图方法
仅1.75公斤!海尔W3 AI外骨骼机器人颠覆行业,轻量化与智能助力双重突破
OpenAI GPT-5.4重磅发布:原生操作电脑、百万Token上下文,专业任务首次超越人类
MobileVD – 首个针对移动设备优化的视频扩散模型
清华重磅开源!OpenMAIC:一键将任意文档转为AI多智能体交互课堂,备课成本仅为传统MOOC千分之一
分享
Email 复制链接 打印
Share
上一篇 gpt-4o-transcribe – OpenAI 推出的语音转文本模型
下一篇 心影大模型 – 心影随形推出的AI模型,深度融合游戏攻略与角色陪伴
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯
PreenCut开源AI视频剪辑工具:基于WhisperX与大模型,实现自然语言秒搜定位,高效视频剪辑新革命
AI 工具 AIGC 资讯
阿里达摩院「灵枢」大模型:12种医学影像秒级分析,性能碾压GPT-4.1,开源引爆医疗AI新浪潮
AI 工具 AIGC 资讯
Ring-lite:仅2.75B激活参数,蚂蚁技术开源轻量级推理模型刷新SOTA
AI 工具 AIGC 资讯

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

上海发布AI微短剧“沪8条”:最高千万资助,全流程AI化重塑出海版图

站外新闻
AI微短剧 上海文旅局 全流程AI化 微短剧出海 沪8条
AIGC 资讯

Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准

站外新闻
AIGC 资讯最新趋势

AI支付革命:蚂蚁集团CEO韩歆毅发布全球首个Token Pay,定义智能体经济新基建

站外新闻
AI支付 Token Pay 支付宝 蚂蚁集团
AI 工具AIGC 资讯

StableAvatar: 复旦微软联手,音频驱动虚拟人视频生成革命,无需后处理即可生成无限长度高清视频

站外新闻
AIGC 复旦大学 数字人 虚拟形象 音频驱动视频生成
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.