Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型
AIGC 资讯

DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型

站外新闻
最近更新: 2026年6月8日 上午1:14
SHARE

DianJin-R1是什么

DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通过推理增强监督和强化学习提升金融推理任务的表现,核心是DianJin-R1-Data数据集,整合了CFLUE、FinQA和中国合规检查(CCC)数据集,涵盖多样化的金融推理场景。 DianJin-R1包括DianJin-R1-7B和DianJin-R1-32B两个版本,均通过监督微调(SFT)和强化学习(RL)两阶段优化,采用组相对策略优化(GRPO)方法,结合双重奖励信号以优化推理质量。在金融领域的CFLUE、FinQA、CCC等基准测试中,DianJin-R1显著优于非推理模型,在CCC数据集上,单次调用推理模型的表现超过多代理系统。

阅读目录
  • DianJin-R1是什么
  • DianJin-R1的主要功能
  • DianJin-R1的技术原理
  • DianJin-R1的项目地址
  • DianJin-R1的应用场景

DianJin-R1

DianJin-R1的主要功能

  • 金融推理增强:通过推理增强监督和强化学习,提升金融任务的推理能力。在金融测试集 CFLUE、FinQA 和 CCC 上,DianJin-R1 的表现优于基础模型。
  • 高质量数据集支持:基于 DianJin-R1-Data 数据集构建,整合了 CFLUE、FinQA 和 CCC 数据集,覆盖多种金融推理场景。
  • 结构化推理输出:模型能以结构化格式生成推理步骤和最终答案,方便理解和应用。
  • 强化学习优化:采用 Group Relative Policy Optimization(GRPO)算法,结合格式奖励和准确性奖励,优化推理质量。
  • 高效推理能力:在实际应用中,DianJin-R1 的单次调用推理模型表现与多代理系统相当甚至更优,且计算成本更低。

DianJin-R1的技术原理

  • 高质量数据集构建:DianJin-R1 的核心是 DianJin-R1-Data 数据集,数据集整合了 CFLUE、FinQA 和专有的中国合规检查(CCC)数据集。涵盖了多样化的金融推理场景,经过验证的注释,确保数据的高质量和领域相关性。
  • 结构化监督微调(SFT):模型通过监督微调(SFT)阶段进行训练,使用结构化格式生成推理步骤和最终答案。具体来说,每个训练实例包括一个问题、推理路径(格式化为 <think>...</think>)和答案(格式化为 <answer>...</answer>)。模型通过学习这些结构化的输入和输出,生成连贯的推理步骤和正确的答案。
  • 强化学习优化:在监督微调的基础上,DianJin-R1 进一步应用了群体相对策略优化(GRPO)算法进行强化学习。该算法引入了双重奖励信号:格式奖励(鼓励生成结构化的输出)和准确性奖励(奖励正确答案),进一步提升推理质量。

DianJin-R1的项目地址

  • Github仓库:https://github.com/aliyun/qwen-dianjin
  • HuggingFace模型库:https://huggingface.co/DianJin
  • arXiv技术论文:https://arxiv.org/pdf/2504.15716

DianJin-R1的应用场景

  • 金融风险评估与合规检查:DianJin-R1 能高效处理复杂的金融合规任务,例如在 CCC(中国合规检查)数据集上的应用中,模型通过单次调用即可实现与多代理系统相当甚至更优的性能,显著降低了计算成本。
  • 金融问答与客户服务:在 FinQA 数据集的测试中,DianJin-R1 展现了强大的金融问答能力,能为客户提供准确的金融信息和解决方案。有助于提升金融机构的客户服务质量和效率。
  • 金融考试与教育:DianJin-R1 在 CFLUE 数据集上的表现尤为突出,准确率从 77.95% 提升至 86.74%。表明模型可以用于金融考试的辅助训练和教育场景,帮助考生更好地理解和掌握金融知识。
  • 复杂金融任务的推理与决策:DianJin-R1 通过结构化推理和强化学习优化,能处理复杂的金融任务,如财务报表分析、投资决策等。
子曰-o1 – 网易有道推出国内首个输出分步式讲解的推理模型
Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型
EvoMap:全球首个AI Agent进化协作平台,破解经验孤岛,实现智能体能力跨个体遗传与进化
面壁智能联手清华开源BitCPM-CANN:手机端跑大模型内存锐减6倍,性能保留率高达97%
OpenSandbox:阿里巴巴开源AI应用安全沙箱平台,为Agent与代码执行构建企业级隔离环境
分享
Email 复制链接 打印
Share
上一篇 Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要
下一篇 BiliNote – 开源 AI 视频笔记工具,自动提取视频内容生成Markdown格式
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯
华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

OlympicArena – 上海交大联合 AI Lab 等推出的多学科认知推理基准测试框架

站外新闻
AIGC 资讯

Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型

站外新闻
AIGC 资讯

SimpleAR – 复旦大学联合字节 Seed 团队推出的图像生成模型

站外新闻
AI 工具AIGC 资讯最新趋势

快手可灵×港科大重磅开源:UnityVideo统一框架破解多模态视频生成难题,零样本泛化能力领跑行业

站外新闻
AIGC 多模态 快手可灵 扩散模型 视频生成
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.