Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型
AIGC 资讯

MiniCPM5-1B – 面壁智能联合清华开源的端侧文本基座模型

站外新闻
最近更新: 2026年6月7日 下午6:50
SHARE

MiniCPM5-1B是什么

MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以 17.9 分超越所有 2B 以下模型,成为全球同级最强开源端侧文本大模型,INT4 量化后仅 0.5GB,可驱动手机、浏览器等终端上的AI 桌宠应用。

阅读目录
  • MiniCPM5-1B是什么
  • MiniCPM5-1B的主要功能
  • MiniCPM5-1B的技术原理
  • 如何使用MiniCPM5-1B
  • MiniCPM5-1B的核心优势
  • MiniCPM5-1B的项目地址
  • MiniCPM5-1B的同类竞品对比
  • MiniCPM5-1B的应用场景

MiniCPM5-1B

MiniCPM5-1B的主要功能

  • 超强文本推理能力:在综合知识、数学推理、代码编程、逻辑推理、指令遵循等维度全面超越同尺寸模型。
  • 端侧原生部署:支持 FP16/INT8/INT4 多精度推理,INT4 量化后权重仅 0.5GB,可在手机、平板、车机、浏览器中直接运行。
  • AI 桌宠应用:可驱动终端本地化的智能陪伴应用,无需联网即可交互。
  • 工具调用与 Agentic 能力:支持工具调用协议,具备端侧 Agent 执行能力。
  • 多框架兼容:支持 LlamaFactory、ms-swift 微调,以及 SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight 等推理框架。

MiniCPM5-1B的技术原理

  • 分级数据治理体系:将预训练数据按质量划分为 L0-L4 五个等级,针对不同语料(高知识密度中英文网页、高质量数学合成数据)实施差异化清洗与筛选策略。
  • 高质量数据合成:构建 Ultra-FineWeb-L3 等合成数据集,用精选高密度数据替代海量低质数据的训练范式。
  • AI 自研训练框架 ForgeTrain:Base Model 由全球首个完全由 AI 编写的生产级大模型预训练框架 ForgeTrain 完成,零人类程序员参与框架代码编写,在华为昇腾上预训练,在英伟达 H100 上训练速度比 Megatron 快 10%。
  • 极致量化压缩:通过 INT4/Q4 量化技术将模型压缩至 0.5GB,实现端侧普适部署。
  • 自研 CPU 推理框架 ArcLight:针对纯 CPU 环境深度优化,无显卡也能流畅运行。

如何使用MiniCPM5-1B

  • 获取模型权重:访问 HuggingFace、ModelScope、GitCode 或魔乐社区下载 MiniCPM5-1B 模型文件。
  • 选择推理框架:根据硬件环境选择 SGLang、vLLM、llama.cpp、Ollama 或面壁自研 ArcLight(CPU 专用)进行加载。
  • 量化部署(可选):对模型进行 INT8 或 INT4 量化,INT4 版本仅需 0.5GB 存储可在手机或浏览器运行。
  • 运行或微调:直接用预训练模型进行推理,或通过 LlamaFactory、ms-swift 进行领域微调后部署到目标设备。
  • 开发端侧应用:基于 MiniCPM-Desk-Pet 等开源项目,快速构建本地 AI 桌宠或智能助手应用。

MiniCPM5-1B的核心优势

  • 全球 2B 以下性能第一:AA-Index 得分 17.9,超越 Qwen3.5-2B(16.3 分)等参数翻倍模型。
  • 智能密度定律验证者:以 1B 参数实现 3 个月前 2B 模型的性能,验证智能密度约每 3.5 个月翻一番。
  • 零门槛部署:不挑硬件、不挑平台,浏览器打开即用,支持 Claude Code 等 AI 编程工具一键安装。
  • 全面开源:模型权重、训练数据集(Ultra-FineWeb-L3)、部署方案全部开源。

MiniCPM5-1B的项目地址

  • GitHub仓库:https://github.com/OpenBMB/MiniCPM
  • HuggingFace模型库:https://huggingface.co/openbmb/MiniCPM5-1B

MiniCPM5-1B的同类竞品对比

对比维度 MiniCPM5-1B Qwen3.5-2B LFM2.5-1.2B-Thinking
参数规模 1B 2B 1.2B
AA-Index 得分 17.9(第一) 16.3 –
综合知识 (MMLU-Pro) 48.85 42.74 47.98
数学推理 (MATH-500) 91.60 30.40 89.00
代码编程 (LCB-Pro) 22.68 0.00 6.19
INT4 量化体积 0.5GB ~1GB+ –
训练框架 AI 自研 ForgeTrain 传统框架 传统框架
端侧部署 浏览器/手机/CPU 全支持 需一定算力 有限支持
开源程度 权重+数据集+框架全开源 权重开源 权重开源

MiniCPM5-1B的应用场景

  • 端侧智能助手:在手机、平板等设备上离线运行,提供随时响应的AI对话与任务处理能力。
  • AI桌宠陪伴:驱动本地化桌宠应用,无需联网即可实现智能互动与情感陪伴。
  • 边缘设备推理:部署于物联网终端和边缘盒子,满足低功耗场景下的文本理解与生成需求。
  • 隐私敏感计算:数据本地处理不上传云端,适用于医疗、金融等对隐私合规要求严格的行业。
  • 低算力代码辅助:在CPU或低显存设备上提供代码补全、逻辑推理等编程支持。
重磅开源|Wall-OSS-0.5:国产具身大模型破解零样本部署难题,无需微调直驱真实机器人
xAI Grok Build:终结手动编码!Grok Build 全链路自动化编程智能体深度解析
2023 年人工智能与开源界的风云变幻 [译]
MOCR:3B参数开源文档解析模型,图形重建能力超越Gemini 3 Pro
SearchClaw:人大自研开源AI深度研究智能体,支持多源检索与自托管部署
分享
Email 复制链接 打印
Share
上一篇 Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达
下一篇 CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Dulus – 开源的 CLI AI Agent,可驱动多模型工具调用
AIGC 资讯
Reasonix – 专为 DeepSeek 推出的开源终端编程 Agent
AIGC 资讯
Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型
AIGC 资讯
CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
AIGC 资讯

相关推荐

量子芯片科技感占位特色图
AI 工具AIGC 资讯

商汤Seko AI重磅升级:发布Seko Space,以‘创编一体’技术重塑漫短剧工业化生产链路

站外新闻
AIGC Seko AI 商汤科技 工业化生产 漫短剧
AI 工具AIGC 资讯

MiniMax发布MMX-CLI:专为AI Agent打造的全模态命令行神器,一键集成七大生成能力

站外新闻
AI Agent MiniMax MMX-CLI 全模态生成 自动化工作流
全息流体渐变通用占位特色图
AIGC 资讯

美国Opus 4.8被曝’蒸馏’中国开源大模型:Anthropic的AI双标之路

站外新闻
AI双标 Anthropic Claude Opus 4.8 大模型蒸馏 开源大模型
AIGC 资讯

谷歌AI搜索频现拼写错误引用户流失,DuckDuckGo下载量飙升:AI准确性危机何解?

站外新闻
DuckDuckGo Transformer架构 大语言模型 用户选择权 谷歌AI搜索
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 支付宝 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.