Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: BitCPM-CANN – 面壁智能联合清华开源的端侧大模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > BitCPM-CANN – 面壁智能联合清华开源的端侧大模型
AIGC 资讯

BitCPM-CANN – 面壁智能联合清华开源的端侧大模型

站外新闻
最近更新: 2026年6月7日 下午6:48
SHARE

BitCPM-CANN是什么

BitCPM-CANN是面壁智能联合清华大学与OpenBMB开源社区联合推出的,中国首个完全基于华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型。模型采用量化感知训练路线,包含0.5B至8B四个尺寸,推理阶段释放约6倍显存红利,模型能力保留率达90.1%–97.2%,标志着国产NPU首次拥有完整的低比特训练栈。

阅读目录
  • BitCPM-CANN是什么
  • BitCPM-CANN的主要功能
  • BitCPM-CANN的技术原理
  • 如何使用BitCPM-CANN
  • BitCPM-CANN的核心优势
  • BitCPM-CANN的项目地址
  • BitCPM-CANN的同类竞品对比
  • BitCPM-CANN的应用场景

BitCPM-CANN

BitCPM-CANN的主要功能

  • 1.58-bit三值大模型推理: 提供0.5B、1B、3B、8B四个参数规格,可在端侧设备上高效运行,8B模型可轻松部署于当前主流旗舰手机。
  • 国产昇腾全链路训练闭环: 从训练到推理完整链路均在华为昇腾平台上原生完成,无需依赖国外GPU进行预训练。
  • 极致显存释放: 相比传统BF16精度,推理阶段释放约6倍显存红利,同等内存可承载远超以往的模型能力。
  • 全精度对照评测验证: 与同尺寸MiniCPM4全精度模型在常识、阅读理解、学科知识、数学与推理等11项任务上完成1:1性能对照。
  • 开源模型与训练底座: 全系列模型权重及基于MindSpeed × Megatron-LM的低比特训练底座均对外开放,支持开发者复现与二次创新。

BitCPM-CANN的技术原理

  • 量化感知训练(QAT): 模型在训练初始阶段即主动学习使用三值权重(-1、0、+1)进行知识表达,非训练完成后再被动压缩,从根本上实现极低比特下的原生生长。
  • 三值权重信息密度最大化: 通过1.58-bit位宽约束迫使每个bit发挥最大知识承载效率,使权重精度取决于每bit承载的知识量非位宽大小。
  • MindSpeed × Megatron-LM训练底座: 基于主干框架在昇腾平台上搭建完整的低比特训练基础设施,包含环境适配、32K长序列支持、并行策略与融合算子体系。
  • 端到端国产算力原生适配: 从最底层量化算子、QAT算法到完整并行策略和训练框架,全部针对华为昇腾进行原生开发与优化,实现训练推理一体化。
  • 系统性可扩展低比特范式: 通过0.5B至8B全尺寸系列的工程验证,证明该低比特训练路线具备跨规模的系统性、可扩展性与工程可复现性。

如何使用BitCPM-CANN

  • 获取开源模型权重: 访问HuggingFace下载0.5B、1B、3B、8B全系列模型权重。
  • 部署训练底座: 基于面壁智能开源的MindSpeed × Megatron-LM低比特训练底座,在华为昇腾平台上完成环境适配、依赖安装与框架部署。
  • 端侧推理运行: 用模型6倍显存红利优势,在当前主流旗舰手机或PC端侧设备上直接运行8B及以下模型进行推理。
  • 二次训练创新: 基于QAT训练基础设施与开源代码,在昇腾平台上进行二次微调、领域适配或更大规模的低比特训练创新。

BitCPM-CANN的核心优势

  • 国产算力闭环突破: 首次在昇腾上实现端到端1.58-bit训练并全精度对照评测至8B级别,打破国产芯片只能跑推理的刻板印象。
  • 性能保留率行业领先: 3B模型能力保留率达97.2%为全档最高,8B达95.7%,0.5B亦达90.1%,系统性可扩展且工程可复现。
  • 训练效率显著优于同类: 此前GPU版BitCPM 1B仅用微软BitNet 2B 1/20的训练算力即实现全面超越,效率优势已验证。
  • 端侧天花板大幅抬升: 6倍显存红利结合MoE架构,有望将50B乃至100B参数超大模型装入终端,使端侧AI能力达到全新高度。

BitCPM-CANN的项目地址

  • HuggingFace模型库:https://huggingface.co/collections/openbmb/bitcpm-cann

BitCPM-CANN的同类竞品对比

对比维度 BitCPM-CANN 微软 BitNet
开发方 面壁智能 / 清华大学 / OpenBMB 微软研究院
技术路线 量化感知训练(QAT) 三值量化训练
训练平台 华为昇腾(国产NPU) 英伟达 GPU
权重精度 1.58-bit(-1, 0, +1) 1.58-bit(-1, 0, +1)
能力保留率 90.1%–97.2%(3B最高97.2%) 未公开同类全精度对照
训练效率 1B仅用BitNet 2B 1/20算力 基准方案
端到端训练 昇腾原生完成 GPU原生完成
开源程度 全系列权重 + 训练底座开源 部分开源
端侧价值 补国产NPU低比特模型供给侧空白 推动三值量化研究

BitCPM-CANN的应用场景

  • 智能手机端侧AI: 在有限内存下运行更大参数模型,未来有望在手机上运行60B大模型,直接提升终端智能水平与用户体验。
  • 国产芯片生态补全: 为高通骁龙8 Gen 4等已支持2-bit推理的端侧芯片提供高质量模型侧供给,实现软硬件协同与生态闭环。
  • 企业级端侧部署: 适用PC、汽车、IoT等设备上的低内存成本大模型推理,对冲全球HBM内存价格飙升带来的供应链压力。
  • 低比特训练研究创新: 为昇腾平台开发者提供可复用、可扩展的QAT公共基础设施,支持基于国产算力的二次训练与微调创新。
阿里Qwen团队重磅开源WebWorld:百万级真实网页世界模型,三大版本赋能下一代智能体
Kimina-Prover – 月之暗面联合 Numina 推出的数学定理证明模型
Wear-Any-Way – 阿里拍立淘团队推出自由定制的虚拟试穿框架
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架
科大讯飞发布讯飞星火X2:国产算力赋能,数学推理与多语言能力比肩国际顶尖
分享
Email 复制链接 打印
Share
上一篇 Xiaomi Auto World Model – 小米推出的辅助驾驶世界模型
下一篇 Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯
联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

HoloDrive – 商汤联合上海AI Lab等机构推出的2D-3D多模态街道场景生成框架

站外新闻
AI 工具AIGC 资讯

蚂蚁Ming-Flash-Omni 2.0开源:100B参数全模态大模型重塑多模态AI格局

站外新闻
AIGC Ming-Flash-Omni 2.0 MoE架构 全模态大模型 多模态AI
AIGC 资讯

TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法

站外新闻
AI 工具AIGC 资讯

浙大华为联手发布DeepSeek-R1-Safe:基于昇腾的安全大模型,开源权重防御越狱攻击

站外新闻
AIGC安全 DeepSeek-R1-Safe 华为昇腾 安全大模型 越狱攻击防御
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.