Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型
AIGC 资讯

DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型

站外新闻
最近更新: 2026年6月8日 上午1:14
SHARE

DianJin-R1是什么

DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通过推理增强监督和强化学习提升金融推理任务的表现,核心是DianJin-R1-Data数据集,整合了CFLUE、FinQA和中国合规检查(CCC)数据集,涵盖多样化的金融推理场景。 DianJin-R1包括DianJin-R1-7B和DianJin-R1-32B两个版本,均通过监督微调(SFT)和强化学习(RL)两阶段优化,采用组相对策略优化(GRPO)方法,结合双重奖励信号以优化推理质量。在金融领域的CFLUE、FinQA、CCC等基准测试中,DianJin-R1显著优于非推理模型,在CCC数据集上,单次调用推理模型的表现超过多代理系统。

阅读目录
  • DianJin-R1是什么
  • DianJin-R1的主要功能
  • DianJin-R1的技术原理
  • DianJin-R1的项目地址
  • DianJin-R1的应用场景

DianJin-R1

DianJin-R1的主要功能

  • 金融推理增强:通过推理增强监督和强化学习,提升金融任务的推理能力。在金融测试集 CFLUE、FinQA 和 CCC 上,DianJin-R1 的表现优于基础模型。
  • 高质量数据集支持:基于 DianJin-R1-Data 数据集构建,整合了 CFLUE、FinQA 和 CCC 数据集,覆盖多种金融推理场景。
  • 结构化推理输出:模型能以结构化格式生成推理步骤和最终答案,方便理解和应用。
  • 强化学习优化:采用 Group Relative Policy Optimization(GRPO)算法,结合格式奖励和准确性奖励,优化推理质量。
  • 高效推理能力:在实际应用中,DianJin-R1 的单次调用推理模型表现与多代理系统相当甚至更优,且计算成本更低。

DianJin-R1的技术原理

  • 高质量数据集构建:DianJin-R1 的核心是 DianJin-R1-Data 数据集,数据集整合了 CFLUE、FinQA 和专有的中国合规检查(CCC)数据集。涵盖了多样化的金融推理场景,经过验证的注释,确保数据的高质量和领域相关性。
  • 结构化监督微调(SFT):模型通过监督微调(SFT)阶段进行训练,使用结构化格式生成推理步骤和最终答案。具体来说,每个训练实例包括一个问题、推理路径(格式化为 <think>...</think>)和答案(格式化为 <answer>...</answer>)。模型通过学习这些结构化的输入和输出,生成连贯的推理步骤和正确的答案。
  • 强化学习优化:在监督微调的基础上,DianJin-R1 进一步应用了群体相对策略优化(GRPO)算法进行强化学习。该算法引入了双重奖励信号:格式奖励(鼓励生成结构化的输出)和准确性奖励(奖励正确答案),进一步提升推理质量。

DianJin-R1的项目地址

  • Github仓库:https://github.com/aliyun/qwen-dianjin
  • HuggingFace模型库:https://huggingface.co/DianJin
  • arXiv技术论文:https://arxiv.org/pdf/2504.15716

DianJin-R1的应用场景

  • 金融风险评估与合规检查:DianJin-R1 能高效处理复杂的金融合规任务,例如在 CCC(中国合规检查)数据集上的应用中,模型通过单次调用即可实现与多代理系统相当甚至更优的性能,显著降低了计算成本。
  • 金融问答与客户服务:在 FinQA 数据集的测试中,DianJin-R1 展现了强大的金融问答能力,能为客户提供准确的金融信息和解决方案。有助于提升金融机构的客户服务质量和效率。
  • 金融考试与教育:DianJin-R1 在 CFLUE 数据集上的表现尤为突出,准确率从 77.95% 提升至 86.74%。表明模型可以用于金融考试的辅助训练和教育场景,帮助考生更好地理解和掌握金融知识。
  • 复杂金融任务的推理与决策:DianJin-R1 通过结构化推理和强化学习优化,能处理复杂的金融任务,如财务报表分析、投资决策等。
Lightpanda:颠覆Chrome!开源AI浏览器,内存仅1/16,速度飙升9倍
OpenAI重磅开源隐私过滤模型:本地运行、支持128K长文本的PII脱敏新方案
法拉利与IBM联手:生成式AI重塑F1车迷体验,App活跃度飙升62%
高德开源SkillClaw:AI Agent技能自动进化框架,实现团队经验零成本复利
html-video – Open Design 团队开源的 HTML 版剪映
分享
Email 复制链接 打印
Share
上一篇 Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Pemo – AI文档管理工具,支持一键翻译智能总结文献摘要
AIGC 资讯
SkyReels-A2 – 昆仑万维推出的可控视频生成框架
AIGC 资讯
GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
AIGC 资讯
Eagle 2.5 – 英伟达推出的视觉语言模型
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

上海AI Lab开源Intern-S2-Preview:35B参数科学大模型,比肩万亿参数,首次实现晶体结构生成

站外新闻
Intern-S2-Preview 上海AI Lab 多模态大模型 开源模型 科学大模型
AI 工具AIGC 资讯

PokeClaw:全球首个全本地离线手机AI Agent,基于Gemma 4开源免费,隐私安全自动化新标杆

站外新闻
AI Agent Android自动化 Gemma 4 开源AI应用 本地离线AI
AIGC 资讯

BrowserAct Skills – 开源的 AI Agent 浏览器自动化 CLI 工具

站外新闻
AIGC 资讯

AI芯片短缺危机!SpaceX Terafab晶圆厂成败难料,或重塑太空AI格局

站外新闻
AI芯片 SpaceX Terafab晶圆厂 半导体供应链 特斯拉
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.