Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: START – 阿里联合中科大推出的自学推理模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > START – 阿里联合中科大推出的自学推理模型
AIGC 资讯

START – 阿里联合中科大推出的自学推理模型

站外新闻
最近更新: 2026年6月8日 下午1:30
SHARE

START是什么

START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升大型语言模型(LLMs)的推理能力。START基于“Hint-infer”技术在推理过程中插入提示,激发模型使用外部工具,基于“Hint-RFT”框架进行自学习和微调。START在长链推理(Long CoT)的基础上,引入工具调用,显著提高在复杂数学问题、科学问答和编程挑战中的准确性和效率。START在多个基准测试中表现出色,超越现有模型,成为首个开源的长链推理与工具集成相结合的模型。

阅读目录
  • START是什么
  • START的主要功能
  • START的技术原理
  • START的项目地址
  • START的应用场景

START

START的主要功能

  • 复杂计算与验证:调用Python代码执行器,进行复杂的数学计算、逻辑验证和模拟。
  • 自我调试与优化:START用工具执行代码并验证输出,自动检测错误并进行调试,提高答案的准确性。
  • 多策略探索:基于提示(Hints)引导模型尝试多种推理路径和方法,增强模型在面对复杂问题时的灵活性和适应性。
  • 提升推理效率:基于工具调用和自我验证,减少模型在复杂任务中的幻觉(hallucination)现象,提高推理效率和可靠性。

START的技术原理

  • 长链推理:继承长链推理的优势,分解问题为多个中间推理步骤,模拟人类的深度思考过程,提高模型在复杂任务中的推理能力。
  • 工具集成:START基于调用外部工具(如Python代码执行器)弥补传统长链推理的不足。模型在推理过程中生成代码,用工具执行验证结果。
  • Hint-infer:在推理过程中插入人工设计的提示(Hints),激发模型调用外部工具的能力。引导模型在特定节点调用工具,无需额外的演示数据。
  • Hint-RFT:结合Hint-infer和拒绝采样微调(RFT),对模型生成的推理轨迹进行评分、过滤和修改,进一步优化模型的工具使用能力。
  • 自学习框架:基于主动学习方法,从模型生成的推理轨迹中筛选出有价值的数据,用于微调,让模型自我学习如何更有效地使用工具。
  • 测试时扩展:在推理结束时插入提示,增加模型的思考时间和工具调用次数,提高推理的准确性和成功率。

START的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2503.04625

START的应用场景

  • 数学问题求解:解决复杂的数学题目,如数学竞赛和高等数学问题,用代码验证提高准确性。
  • 科学研究辅助:帮助处理物理、化学和生物等领域的复杂计算和科学问题。
  • 编程与调试:生成代码并自动调试,解决编程难题,提升开发效率。
  • 跨学科问题解决:综合运用多学科知识,解决工程设计、数据分析等复杂任务。
  • 教育与学习:作为智能辅导工具,辅助学生学习数学和科学,提供详细的解题过程和反馈。
OmniManip – 智元机器人联合北大推出的通用机器人操作框架
​腾讯与人大高瓴联合推出开源规划评测框架 PlanningBench
DeepMind Dreamer 4:仅用离线数据,《我的世界》里挖钻石!世界模型智能体实现高效安全想象训练
Glyph视觉压缩框架:智谱清华联手,大模型推理速度提升4倍,显存占用直降2/3
谷歌发布首款本地具身智能模型Gemini Robotics On-Device:50个样本即可学会新任务,机器人离线精细操作时代来临
分享
Email 复制链接 打印
Share
上一篇 Amazon Nova Premier – 亚马逊推出的多模态AI模型
下一篇 BioMedGPT-R1 – 清华联合水木分子推出的多模态生物医药大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Self Forcing: Adobe与德克萨斯大学联合推出实时视频生成模型,单GPU实现17FPS,告别传统AI视频生成延迟
AI 工具 AIGC 资讯
腾讯AI Lab重磅开源SongGeneration:AI音乐生成大模型,多轨合成、风格克隆,媲美商业模型
AI 工具 AIGC 资讯
快手OneRec:颠覆传统推荐!端到端生成式AI系统引爆观看时长与GMV
AI 工具 AIGC 资讯
Kimi-Researcher:月之暗面端到端强化学习Agent,深度研究基准测试超Claude 4 Opus
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

字节豆包1.6 Lite发布:性能飙升14%成本骤降53%,轻量级AI模型如何重塑企业智能应用?

站外新闻
AIGC 企业级应用 字节跳动 豆包大模型 轻量级AI模型
AIGC 资讯最新趋势

12岁孩童用眉笔画胡子破解AI年龄验证:轻量级模型的技术漏洞引发行业警示

站外新闻
AI模型 年龄验证 技术漏洞 隐私保护 面部识别
AI 工具AIGC 资讯

腾讯清华联手开源 Pixal3D:单图秒变重建级3D资产,PBR材质一步到位

站外新闻
PBR材质 Pixal3D SIGGRAPH 2026 单图3D生成 腾讯ARC
AIGC 资讯

autoMate – AI本地自动化工具,自然语言实现自动化任务操作

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.