Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Light-R1 – 360智脑开源的长思维链推理模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Light-R1 – 360智脑开源的长思维链推理模型
AIGC 资讯

Light-R1 – 360智脑开源的长思维链推理模型

站外新闻
最近更新: 2026年6月8日 上午7:19
SHARE

Light-R1是什么

Light-R1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7万条数学数据和两阶段课程学习(SFT+DPO)训练,实现从零超越DeepSeek-R1-Distill-Qwen-32B的性能。在AIME24测试中,Light-R1取得76.6分,显著高于DeepSeek-R1-Distill的72.6分。模型训练成本低,仅需12台H800机器运行6小时,成本约1000美元。模型支持全量开源,包括模型、数据集、训练框架和评测代码,推动开源社区发展,为低成本训练领域专精模型提供参考。

阅读目录
  • Light-R1是什么
  • Light-R1的主要功能
  • Light-R1的技术原理
  • Light-R1的项目地址
  • Light-R1的应用场景

Light-R1

Light-R1的主要功能

  • 高效数学问题解决:能快速、准确地解决复杂的数学问题,包括但不限于代数、几何、概率等领域。
  • 推理能力提升:具备较强的逻辑推理能力,支持处理长思维链问题。
  • 泛化能力:在其他领域(如逻辑推理、语言理解)表现出泛化能力。
  • 低成本训练与部署:极低的成本实现高性能,适合资源有限的用户或企业快速部署和应用。

Light-R1的技术原理

  • 基础模型与起点:模型基于 Qwen2.5-32B-Instruct 开发,实现从零到超越 DeepSeek-R1-Distill 的性能提升。
  • 课程学习:
    • SFT(Supervised Fine-Tuning):筛选难度分级的数据,分两阶段进行有监督的微调。第一阶段用 7 万条数据,第二阶段筛选出难度最高的 3 千条数据进一步微调。
    • DPO(Direct Preference Optimization):在 SFT 的基础上,基于多次采样和偏好对的构建,优化模型的输出质量。
  • 数据处理与去重:训练数据来自多个开源数学数据集(如 OpenR1-Math-220k、OpenThoughts-114k 等),经过严格的数据去重处理,避免测试数据泄露对模型性能的影响。
  • 模型融合:最终的 Light-R1-32B 是融合 SFT 阶段 2、DPO 和另一个 DPO 版本的模型得到的。进一步提升模型的性能和稳定性。
  • 训练框架与优化:用 360-LLaMA-Factory 训练框架,支持序列并行和高效的分布式训练。基于优化训练流程,Light-R1 在 12 台 H800 机器上仅需 6 小时即可完成训练。

Light-R1的项目地址

  • GitHub仓库:https://github.com/Qihoo360/Light-R1
  • HuggingFace模型库:https://huggingface.co/collections/qihoo360/light-r1

Light-R1的应用场景

  • 教育领域:作为数学学习工具,帮助学生解决复杂问题,提供解题步骤和思路,适用于数学竞赛和日常学习。
  • 科研与学术:辅助数学研究和跨学科问题解决,例如物理建模、工程优化等。
  • 企业应用:用于数据分析、风险评估、供应链优化等复杂问题的解决。
  • 软件集成:集成到智能助手、数学软件中,增强推理和解题功能。
  • 开源与开发者:支持开发者定制和扩展模型,推动开源社区发展。
中国将首发公有云大模型 Token 性能榜,日均调用量已突破 140 万亿次
苹果AI图像生成迎来史诗级升级:Image Playground依托Gemini与私有云,OS27能否重塑用户口碑?
仅1.75公斤!海尔W3 AI外骨骼机器人颠覆行业,轻量化与智能助力双重突破
AI颠覆开店选址!高德×钉钉悟空发布智能助手,告别‘蹲点’时代
拼多多重拳出击!AI押题、数据投毒等灰产被全面封禁,上半年已出台40余项治理措施
分享
Email 复制链接 打印
Share
上一篇 gpt-4o-transcribe – OpenAI 推出的语音转文本模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

gpt-4o-transcribe – OpenAI 推出的语音转文本模型
AIGC 资讯
风宇 – 中国气象局联合华为和南昌大学推出的空间天气大模型
AIGC 资讯
Sketch2Anim – 爱丁堡大学等机构推出的2D草图转3D动画框架
AIGC 资讯
DeepSeek-GRM – DeepSeek 联合清华推出的通用奖励模型
AIGC 资讯

相关推荐

2023: 人工智能之年
AIGC 资讯

2023: AI 的一年 [译]

宝玉的分享
AIGC AI发展 AI资讯
AI 工具AIGC 资讯

Anthropic发布Claude Opus 4.8:代码缺陷率暴跌75%,速度提升2.5倍碾压GPT-5.5

站外新闻
AIGC Anthropic Claude Opus 4.8 智能体编程
AI 工具AIGC 资讯

美团开源LongCat-AudioDiT:波形潜空间扩散TTS模型,零样本语音克隆性能超越Seed-TTS SOTA

站外新闻
AIGC 大模型 开源模型 文本转语音 语音克隆
AIGC 资讯

SkyClaw-v1.0 – 昆仑万维天工AI推出的高性能Agent模型

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.