Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
AIGC 资讯

MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型

站外新闻
最近更新: 2026年6月7日 下午6:50
SHARE

MiniCPM5-1B是什么

MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以 17.9 分超越所有 2B 以下模型,成为全球同级最强开源端侧文本大模型,INT4 量化后仅 0.5GB,可驱动手机、浏览器等终端上的AI 桌宠应用。

阅读目录
  • MiniCPM5-1B是什么
  • MiniCPM5-1B的主要功能
  • MiniCPM5-1B的技术原理
  • 如何使用MiniCPM5-1B
  • MiniCPM5-1B的核心优势
  • MiniCPM5-1B的项目地址
  • MiniCPM5-1B的同类竞品对比
  • MiniCPM5-1B的应用场景

MiniCPM5-1B

MiniCPM5-1B的主要功能

  • 超强文本推理能力:在综合知识、数学推理、代码编程、逻辑推理、指令遵循等维度全面超越同尺寸模型。
  • 端侧原生部署:支持 FP16/INT8/INT4 多精度推理,INT4 量化后权重仅 0.5GB,可在手机、平板、车机、浏览器中直接运行。
  • AI 桌宠应用:可驱动终端本地化的智能陪伴应用,无需联网即可交互。
  • 工具调用与 Agentic 能力:支持工具调用协议,具备端侧 Agent 执行能力。
  • 多框架兼容:支持 LlamaFactory、ms-swift 微调,以及 SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight 等推理框架。

MiniCPM5-1B的技术原理

  • 分级数据治理体系:将预训练数据按质量划分为 L0-L4 五个等级,针对不同语料(高知识密度中英文网页、高质量数学合成数据)实施差异化清洗与筛选策略。
  • 高质量数据合成:构建 Ultra-FineWeb-L3 等合成数据集,用精选高密度数据替代海量低质数据的训练范式。
  • AI 自研训练框架 ForgeTrain:Base Model 由全球首个完全由 AI 编写的生产级大模型预训练框架 ForgeTrain 完成,零人类程序员参与框架代码编写,在华为昇腾上预训练,在英伟达 H100 上训练速度比 Megatron 快 10%。
  • 极致量化压缩:通过 INT4/Q4 量化技术将模型压缩至 0.5GB,实现端侧普适部署。
  • 自研 CPU 推理框架 ArcLight:针对纯 CPU 环境深度优化,无显卡也能流畅运行。

如何使用MiniCPM5-1B

  • 获取模型权重:访问 HuggingFace、ModelScope、GitCode 或魔乐社区下载 MiniCPM5-1B 模型文件。
  • 选择推理框架:根据硬件环境选择 SGLang、vLLM、llama.cpp、Ollama 或面壁自研 ArcLight(CPU 专用)进行加载。
  • 量化部署(可选):对模型进行 INT8 或 INT4 量化,INT4 版本仅需 0.5GB 存储可在手机或浏览器运行。
  • 运行或微调:直接用预训练模型进行推理,或通过 LlamaFactory、ms-swift 进行领域微调后部署到目标设备。
  • 开发端侧应用:基于 MiniCPM-Desk-Pet 等开源项目,快速构建本地 AI 桌宠或智能助手应用。

MiniCPM5-1B的核心优势

  • 全球 2B 以下性能第一:AA-Index 得分 17.9,超越 Qwen3.5-2B(16.3 分)等参数翻倍模型。
  • 智能密度定律验证者:以 1B 参数实现 3 个月前 2B 模型的性能,验证智能密度约每 3.5 个月翻一番。
  • 零门槛部署:不挑硬件、不挑平台,浏览器打开即用,支持 Claude Code 等 AI 编程工具一键安装。
  • 全面开源:模型权重、训练数据集(Ultra-FineWeb-L3)、部署方案全部开源。

MiniCPM5-1B的项目地址

  • GitHub仓库:https://github.com/OpenBMB/MiniCPM
  • HuggingFace模型库:https://huggingface.co/openbmb/MiniCPM5-1B

MiniCPM5-1B的同类竞品对比

对比维度 MiniCPM5-1B Qwen3.5-2B LFM2.5-1.2B-Thinking
参数规模 1B 2B 1.2B
AA-Index 得分 17.9(第一) 16.3 –
综合知识 (MMLU-Pro) 48.85 42.74 47.98
数学推理 (MATH-500) 91.60 30.40 89.00
代码编程 (LCB-Pro) 22.68 0.00 6.19
INT4 量化体积 0.5GB ~1GB+ –
训练框架 AI 自研 ForgeTrain 传统框架 传统框架
端侧部署 浏览器/手机/CPU 全支持 需一定算力 有限支持
开源程度 权重+数据集+框架全开源 权重开源 权重开源

MiniCPM5-1B的应用场景

  • 端侧智能助手:在手机、平板等设备上离线运行,提供随时响应的AI对话与任务处理能力。
  • AI桌宠陪伴:驱动本地化桌宠应用,无需联网即可实现智能互动与情感陪伴。
  • 边缘设备推理:部署于物联网终端和边缘盒子,满足低功耗场景下的文本理解与生成需求。
  • 隐私敏感计算:数据本地处理不上传云端,适用于医疗、金融等对隐私合规要求严格的行业。
  • 低算力代码辅助:在CPU或低显存设备上提供代码补全、逻辑推理等编程支持。
腾讯优图开源企业级文本嵌入模型Youtu-Embedding:中文语义评测CMTEB领先,助力智能客服与知识管理
VLN-R1:港大联合上海AI Lab发布具身智能框架,用视觉语言模型实现3D连续导航
AVD2 – 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架
蚂蚁开源Ming-Flash-Omni 2.0:100B参数全模态大模型,统一理解与生成
DeepSeek-OCR开源:10倍压缩97%精度,高效文档处理迎来颠覆性突破
分享
Email 复制链接 打印
Share
上一篇 Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达
下一篇 CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

华为盘古大模型5.5震撼发布:7180亿参数Ultra MoE领衔,五大模型重塑产业智能
AI 工具 AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
AI 工具 AIGC 资讯
联影智能发布‘元智’医疗大模型:多模态融合,一次CT扫描诊断37种疾病
AI 工具 AIGC 资讯
Dive3D重磅发布:北大x小红书联手破解文本生成3D多样性难题,SIM损失取代KL散度实现模式突破
AI 工具 AIGC 资讯

相关推荐

AI 工具AIGC 资讯

阿里通义EAPO框架:30B小模型反超120B闭源大模型的强化学习突破,ACL 2026论文详解

站外新闻
EAPO 大模型 强化学习 长文本推理 阿里通义
AIGC 资讯

文心大模型X1 – 百度推出的深度思考模型

站外新闻
AIGC 资讯

Voila – 开源端到端语音大模型,实现低延迟语音对话

站外新闻
AI 工具AIGC 资讯

谷歌Veo 3.1重磅发布:AI视频生成进入4K竖屏+原生音频时代,一文详解功能、价格与使用

站外新闻
AIGC AI视频生成 Gemini API Veo 3.1 谷歌
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程助手 AI编程工具 AI编程模型 AI视频生成 AI音乐生成 Anthropic chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax MoE架构 MoE模型 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 清华大学 知识管理 科大讯飞 端侧AI 美团 腾讯 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.