Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: BitCPM-CANN – 面壁智能联合清华开源的端侧大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > BitCPM-CANN – 面壁智能联合清华开源的端侧大模型
AIGC 资讯

BitCPM-CANN – 面壁智能联合清华开源的端侧大模型

站外新闻
最近更新: 2026年6月7日 下午6:48
SHARE

BitCPM-CANN是什么

BitCPM-CANN是面壁智能联合清华大学与OpenBMB开源社区联合推出的,中国首个完全基于华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型。模型采用量化感知训练路线,包含0.5B至8B四个尺寸,推理阶段释放约6倍显存红利,模型能力保留率达90.1%–97.2%,标志着国产NPU首次拥有完整的低比特训练栈。

阅读目录
  • BitCPM-CANN是什么
  • BitCPM-CANN的主要功能
  • BitCPM-CANN的技术原理
  • 如何使用BitCPM-CANN
  • BitCPM-CANN的核心优势
  • BitCPM-CANN的项目地址
  • BitCPM-CANN的同类竞品对比
  • BitCPM-CANN的应用场景

BitCPM-CANN

BitCPM-CANN的主要功能

  • 1.58-bit三值大模型推理: 提供0.5B、1B、3B、8B四个参数规格,可在端侧设备上高效运行,8B模型可轻松部署于当前主流旗舰手机。
  • 国产昇腾全链路训练闭环: 从训练到推理完整链路均在华为昇腾平台上原生完成,无需依赖国外GPU进行预训练。
  • 极致显存释放: 相比传统BF16精度,推理阶段释放约6倍显存红利,同等内存可承载远超以往的模型能力。
  • 全精度对照评测验证: 与同尺寸MiniCPM4全精度模型在常识、阅读理解、学科知识、数学与推理等11项任务上完成1:1性能对照。
  • 开源模型与训练底座: 全系列模型权重及基于MindSpeed × Megatron-LM的低比特训练底座均对外开放,支持开发者复现与二次创新。

BitCPM-CANN的技术原理

  • 量化感知训练(QAT): 模型在训练初始阶段即主动学习使用三值权重(-1、0、+1)进行知识表达,非训练完成后再被动压缩,从根本上实现极低比特下的原生生长。
  • 三值权重信息密度最大化: 通过1.58-bit位宽约束迫使每个bit发挥最大知识承载效率,使权重精度取决于每bit承载的知识量非位宽大小。
  • MindSpeed × Megatron-LM训练底座: 基于主干框架在昇腾平台上搭建完整的低比特训练基础设施,包含环境适配、32K长序列支持、并行策略与融合算子体系。
  • 端到端国产算力原生适配: 从最底层量化算子、QAT算法到完整并行策略和训练框架,全部针对华为昇腾进行原生开发与优化,实现训练推理一体化。
  • 系统性可扩展低比特范式: 通过0.5B至8B全尺寸系列的工程验证,证明该低比特训练路线具备跨规模的系统性、可扩展性与工程可复现性。

如何使用BitCPM-CANN

  • 获取开源模型权重: 访问HuggingFace下载0.5B、1B、3B、8B全系列模型权重。
  • 部署训练底座: 基于面壁智能开源的MindSpeed × Megatron-LM低比特训练底座,在华为昇腾平台上完成环境适配、依赖安装与框架部署。
  • 端侧推理运行: 用模型6倍显存红利优势,在当前主流旗舰手机或PC端侧设备上直接运行8B及以下模型进行推理。
  • 二次训练创新: 基于QAT训练基础设施与开源代码,在昇腾平台上进行二次微调、领域适配或更大规模的低比特训练创新。

BitCPM-CANN的核心优势

  • 国产算力闭环突破: 首次在昇腾上实现端到端1.58-bit训练并全精度对照评测至8B级别,打破国产芯片只能跑推理的刻板印象。
  • 性能保留率行业领先: 3B模型能力保留率达97.2%为全档最高,8B达95.7%,0.5B亦达90.1%,系统性可扩展且工程可复现。
  • 训练效率显著优于同类: 此前GPU版BitCPM 1B仅用微软BitNet 2B 1/20的训练算力即实现全面超越,效率优势已验证。
  • 端侧天花板大幅抬升: 6倍显存红利结合MoE架构,有望将50B乃至100B参数超大模型装入终端,使端侧AI能力达到全新高度。

BitCPM-CANN的项目地址

  • HuggingFace模型库:https://huggingface.co/collections/openbmb/bitcpm-cann

BitCPM-CANN的同类竞品对比

对比维度 BitCPM-CANN 微软 BitNet
开发方 面壁智能 / 清华大学 / OpenBMB 微软研究院
技术路线 量化感知训练(QAT) 三值量化训练
训练平台 华为昇腾(国产NPU) 英伟达 GPU
权重精度 1.58-bit(-1, 0, +1) 1.58-bit(-1, 0, +1)
能力保留率 90.1%–97.2%(3B最高97.2%) 未公开同类全精度对照
训练效率 1B仅用BitNet 2B 1/20算力 基准方案
端到端训练 昇腾原生完成 GPU原生完成
开源程度 全系列权重 + 训练底座开源 部分开源
端侧价值 补国产NPU低比特模型供给侧空白 推动三值量化研究

BitCPM-CANN的应用场景

  • 智能手机端侧AI: 在有限内存下运行更大参数模型,未来有望在手机上运行60B大模型,直接提升终端智能水平与用户体验。
  • 国产芯片生态补全: 为高通骁龙8 Gen 4等已支持2-bit推理的端侧芯片提供高质量模型侧供给,实现软硬件协同与生态闭环。
  • 企业级端侧部署: 适用PC、汽车、IoT等设备上的低内存成本大模型推理,对冲全球HBM内存价格飙升带来的供应链压力。
  • 低比特训练研究创新: 为昇腾平台开发者提供可复用、可扩展的QAT公共基础设施,支持基于国产算力的二次训练与微调创新。
联想AI矩阵全线落地:百应+天禧双引擎驱动,以‘词元经济’重塑企业与个人生产力
OpenAI GPT-Realtime-Whisper 实时语音转文字模型发布:低至每分钟0.017美元,实现边说边出字的超低延迟转录
阿里通义重磅发布PrismAudio:全球首创分解式思维链V2A框架,0.63秒为视频智能配音
告别排队!腾讯ima Copilot全面开放,知识技能共享生态引爆AIGC新潮流
估值一年翻倍!AI网关巨头OpenRouter获谷歌1.13亿美元投资,揭示多模型调度万亿市场
分享
Email 复制链接 打印
Share
上一篇 DataBuddy – 腾讯云推出的大数据智能体工作台
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

DataBuddy – 腾讯云推出的大数据智能体工作台
AIGC 资讯
AgentScope 2.0 – 通义实验室开源的多智能体开发框架
AIGC 资讯
Aholo Viewer – 群核科技开源的 3D 高斯浏览器
AIGC 资讯
omp – 开源的 AI 终端编程智能体,能与 IDE 深度联动
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

美团开源LongCat-AudioDiT:波形潜空间扩散TTS模型,零样本语音克隆性能超越Seed-TTS SOTA

站外新闻
AIGC 大模型 开源模型 文本转语音 语音克隆
AI 工具AIGC 资讯

快手KAT-Coder-Pro V2重磅发布:SWE-Bench追平GPT-5,前端美学生成断层领先,国产AI编程模型新标杆

站外新闻
Agentic Coding AI编程模型 KAT-Coder-Pro V2 SWE-Bench 快手KwaiKAT
AI 工具AIGC 资讯

阿里千问重磅发布Qwen3.7-Max:全栈AI智能体赋能编程、办公与长周期任务

站外新闻
AIGC AI智能体 Qwen3.7-Max 阿里千问
AI 工具AIGC 资讯

商汤绝影发布端侧智能体基座Sage:3B激活参数超越云端模型,重塑智能座舱

站外新闻
MoE架构 商汤绝影 智能体 智能座舱 端侧大模型
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 支付宝 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.