Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: CAR:字节跳动×复旦重磅推出!自适应推理框架让大模型效率飙升,准确率再攀新高
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > CAR:字节跳动×复旦重磅推出!自适应推理框架让大模型效率飙升,准确率再攀新高
AIGC 资讯

CAR:字节跳动×复旦重磅推出!自适应推理框架让大模型效率飙升,准确率再攀新高

站外新闻
最近更新: 2026年6月7日 下午8:28
CAR 复旦大学 大型语言模型 字节跳动 推理框架
SHARE

💡 站外导读:随着大模型应用场景的不断扩展,如何在保障准确性的前提下提升推理效率,已成为行业核心痛点。传统模型面对复杂问题时统一采用长链推理,导致算力成本高昂、响应延迟明显;面对简单问题又可能因过度思考而浪费资源。字节跳动与复旦大学联合推出的CAR框架,正是为解决这一矛盾而生。它通过基于置信度的动态推理切换,让模型能智能选择最优推理路径,在效率与准确性间取得最佳平衡,为大模型的规模化落地提供了全新解题思路。

CAR是什么

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,能提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在不同任务中的推理效率与准确性。框架基于动态地在短答案和长形式推理之间切换,根据模型对答案的置信度(通过困惑度PPL衡量)决定是否需要进行详细推理。当模型对短答案的置信度较低时,CAR会触发长形式推理提高答案的准确性,当置信度较高时,直接输出短答案,节省计算资源和时间。CAR在视觉问答(VQA)和关键信息提取(KIE)等任务中表现突出,在数学等复杂推理任务中展现出良好的性能。

阅读目录
  • CAR是什么
  • CAR的主要功能
  • CAR的技术原理
  • CAR的项目地址
  • CAR的应用场景
      • 📝 站长洞察 (Editor’s Insight)

CAR

CAR的主要功能

  • 动态推理切换:CAR能智能地在短答案和长形式推理之间进行切换。对于简单问题,直接输出短答案提高效率;对于复杂问题,触发长形式推理确保准确性。
  • 提升推理效率:CAR显著减少模型生成的token数量,降低计算成本和推理时间,提高模型在实际应用中的效率。
  • 提高推理准确性:在需要详细推理的情况下,激活长形式推理,提高模型在复杂任务中的表现,确保推理结果的准确性。
  • 适应多种任务:CAR适用视觉问答(VQA)和关键信息提取(KIE)等任务,在数学推理、常识推理等复杂任务中发挥作用,具有广泛的适用性。

CAR的技术原理

  • 模型训练:用包含短答案和长形式推理答案的训练数据对LLM或MLLM进行训练。训练时,模型需要学习如何根据不同的提示生成相应的短答案或长形式推理答案。优化目标是交叉熵损失,用最小化预测token的概率分布与真实token的分布之间的差异训练模型。
  • 获取短答案的PPL:在训练数据上进行短答案推理,计算每个短答案的困惑度(PPL)。PPL是衡量模型对答案置信度的指标,PPL越低,表示模型对答案的置信度越高。
  • 高斯分布建模:假设正确和错误短答案的PPL分数分别服从高斯分布。基于训练数据估计分布的参数,分别计算正确和错误答案的PPL均值和方差,得到两个高斯分布模型。
  • 推理过程:对于新的输入,首先生成短答案计算PPL值。根据高斯分布模型计算该PPL值下答案正确的概率。

CAR的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2505.15154

CAR的应用场景

  • 视觉问答(VQA):CAR在简单问题上直接输出短答案,提高效率;在复杂问题上触发长形式推理,确保准确。
  • 关键信息提取(KIE):根据置信度动态选择推理方式,减少token使用量,保持高准确率。
  • 数学推理:在简单数学问题上直接输出答案,在复杂问题上进行详细推理,提升准确性和效率。
  • 常识推理:针对简单常识问题直接给出答案,复杂问题则进行长形式推理,减少token消耗。
  • 多模态任务:结合文本和图像信息,动态选择推理方式,提升多模态任务的准确性和效率。

📝 站长洞察 (Editor’s Insight)

CAR框架的推出,精准踩中了当前大模型产业化的关键节点——从“模型能力竞赛”转向“推理效能深挖”。它揭示的深层趋势是:未来大模型的竞争,将不仅是参数规模的比拼,更是推理智能的较量。CAR通过置信度驱动的自适应机制,本质上赋予了模型一种“元认知”能力,让它能够评估自身答案的可靠性并动态调整策略。这种思路与人类的认知决策过程高度相似,标志着模型设计正从静态计算向动态智能演进。从产业角度看,CAR为降低API调用成本、提升端侧部署可行性提供了极具前景的方案,尤其对追求高并发、低延迟的应用场景意义重大。它暗示着,下一阶段的技术突破点将集中于模型自我优化与资源动态分配的精细化管理,这或许是实现AI普惠与商业可持续性的关键钥匙。

Command A – Cohere 推出的生成式 AI 模型
破解AI记忆三周魔咒!腾讯混元Hy-Memory发布:记忆密度提升45%、Token消耗降低35%,定义Agent长期协作新范式
KuaiMod – 快手推出的自动化短视频质量判别框架
北大微软联手突破:Next-Frame Diffusion实现30+FPS实时自回归视频生成,扩散模型与因果注意力新范式
Aholo Viewer – 群核科技开源的 3D 高斯浏览器
TAGGED:CAR复旦大学大型语言模型字节跳动推理框架
分享
Email 复制链接 打印
Share
上一篇 Onit:开源Mac AI助手,高亮即问、无缝接入多模型,效率飙升
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Onit:开源Mac AI助手,高亮即问、无缝接入多模型,效率飙升
AI 工具
出门问问Mobvoi MCP Server:一站式多模态AI开发平台,集成语音克隆与数字人,开源驱动智能生产力
AI 工具 AIGC 资讯
OmniSync:人大-快手-清华联合打造,通用对口型框架实现无限时长精准同步
AI 工具 AIGC 资讯
FLUX.1 Kontext深度解析:Black Forest Labs开源图像编辑模型,12B参数挑战GPT-4o,实现上下文感知生成与角色一致性
AI 工具

相关推荐

AI 工具AIGC 资讯

科大讯飞开源企业级AI智能体平台 Astron Agent:一键部署高可用工作流,集成RPA实现决策到行动闭环

站外新闻
Astron Agent RPA自动化 企业智能工作流 智能体平台 科大讯飞
AI 工具AIGC 资讯

智谱AI发布SCAIL:影视级角色动画生成框架,一键实现多人复杂交互与照片驱动动画

站外新闻
AIGC Diffusion-Transformer SCAIL 智谱AI 角色动画生成
AIGC 资讯

AgentScope 2.0 – 通义实验室开源的多智能体开发框架

站外新闻
AI 工具AIGC 资讯最新趋势

Webwright 开源:微软发布代码驱动网页智能体,彻底告别传统点击模式

站外新闻
Playwright Web Agent 代码驱动 开源框架 微软 网页智能体
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.