Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > 赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
AIGC 资讯

赤兔Chitu – 清华联合清程极智开源的大模型推理引擎

站外新闻
最近更新: 2026年6月8日 上午6:00
SHARE

Chitu是什么

Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适配能力,支持英伟达多款GPU及国产芯片,打破了对特定硬件(如英伟达Hopper架构)的依赖。 在性能方面,在A800集群上部署DeepSeek-R1-671B时,相比部分国外开源框架,GPU使用量减少50%,推理速度提升3.15倍。支持从纯CPU到大规模集群的全场景部署,能满足不同规模和场景下的推理需求。

阅读目录
  • Chitu是什么
  • Chitu的主要功能
  • Chitu的技术原理
  • Chitu的项目地址
  • Chitu的应用场景

Chitu赤兔

Chitu的主要功能

  • 多元算力适配:支持英伟达从最新旗舰到旧款的多系列GPU,同时为国产芯片提供优化支持,打破了对英伟达Hopper架构的依赖。
  • 全场景可伸缩:从纯CPU部署、单GPU部署到大规模集群部署,赤兔引擎都能提供可扩展的解决方案,满足不同规模和场景下的推理需求。
  • 低延迟优化:针对对延迟敏感的场景,如金融风控等,优化模型推理速度,减少响应时间。
  • 高吞吐优化:在高并发场景下,如智能客服,提高单位时间内处理的请求数量。
  • 小显存优化:降低单卡显存占用,使企业可以用更少的硬件资源获得更高的推理性能。
  • 长期稳定运行:赤兔引擎可应用于实际生产环境,稳定性足以承载并发业务流量。
  • 开箱即用:清程极智推出了基于赤兔的推理一体机,提供开箱即用的部署方案及专业运维服务,进一步简化企业AI落地流程。

Chitu的技术原理

  • 底层技术革新:赤兔引擎通过底层技术革新,首次实现了在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型。打破了过去FP8模型对英伟达H系列高端GPU的依赖,使企业可以在更多类型的硬件上高效部署大模型。
  • 算子级优化:赤兔对关键算子(如GeMM、MoE等)进行了指令级优化,直接处理FP8数据而非简单量化。确保了模型精度无损,同时显著提升了推理速度。在A800集群的测试中,相比部分国外开源框架,赤兔引擎在GPU使用量减少50%的情况下,推理速度仍有3.15倍的提升。
  • 全场景性能优化:赤兔引擎支持低延迟、高吞吐和小显存优化,能根据不同场景需求,在不同硬件配置和系统环境下,提供最优解决方案。赤兔可以根据系统资源状况,在GPU利用率、内存效率和网络传输之间寻找最佳平衡点。
  • 并行计算与编译优化:赤兔引擎凝结了清华大学团队多年的并行计算与编译优化技术积累。通过智能编译技术,团队能够加速高性能算子的开发过程,在较短时间内实现对不同硬件架构的优化。

Chitu的项目地址

  • Github仓库:https://github.com/thu-pacman/chitu

Chitu的应用场景

  • 风险识别与预警:赤兔引擎能快速处理海量交易数据,实时监测潜在风险并及时预警,帮助金融机构提升风险管理效率。
  • 智能客服与客户体验优化:通过大模型智能知识库,快速响应客户需求,提升服务体验。
  • 疾病诊断辅助:赤兔引擎能快速处理医疗数据,提升疾病诊断的速度和准确性,改善患者的就医体验。
  • 交通流量优化:赤兔引擎可以实时处理交通数据,优化交通流量,缓解城市拥堵。
  • 科研数据分析:赤兔引擎能高效处理科研数据,加速科研进程。
擎朗XMAN-L1人形机器人重磅发布:接入豆包腾讯大模型,42自由度轻量化设计引领商用服务新范式
谷歌DeepMind推出AlphaProof Nexus:AI攻克56年数学悬题,颠覆科学发现范式
Multica开源AI Agent协作平台:让Claude Code、Codex成为你的团队正式成员
MAI-Code-1-Flash – 微软推出的轻量级代码生成模型
Robinhood 发布 Agentic Trading 与 AI 信用卡:用户可将第三方 AI 智能体接入平台实现自主交易,开启金融自动化新纪元
分享
Email 复制链接 打印
Share
上一篇 DeerFlow – 字节跳动开源的深度研究框架
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DeerFlow – 字节跳动开源的深度研究框架
AIGC 资讯
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架
AIGC 资讯
Skywork-OR1 – 昆仑万维开源的高性能系列推理模型
AIGC 资讯
Agent TARS – 字节跳动开源的多模态 AI Agent 项目
AIGC 资讯

相关推荐

流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

AI声纹侵权第一案:日本声优起诉TikTok盗用声音,灰色产业链引发版权危机

站外新闻
AIGC TikTok 声纹版权 声音侵权 生成式AI
量子芯片科技感占位特色图
AI 工具AIGC 资讯

谷歌 Gemini 算力计费引爆全球用户怒火!紧急宣布额度永久翻 3 倍补偿

站外新闻
AI 工具 开发者工具 算力计费 谷歌 DeepMind 谷歌 Gemini
AI 工具AIGC 资讯

ChatClaw:智麻开源AI智能体,30MB极简部署,5分钟私有化AI助手,支持钉钉飞书企微多平台接入

站外新闻
AI智能体 MCP协议 多平台接入 本地知识库 私有化部署
AI 工具AIGC 资讯

企业微信官方开源wecom-cli:AI Agent一站式操控7大核心能力,命令行工具革新企业协同

站外新闻
AI Agent 企业微信 命令行工具 开源项目 自动化办公
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.