Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍
AI 工具AIGC 资讯

腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍

站外新闻
最近更新: 2026年6月7日 下午8:07
模型量化 端侧AI 腾讯混元 边缘计算
SHARE

💡 站外导读:当前,大模型在云端运行面临隐私泄露、网络延迟和高功耗等挑战,尤其在移动和IoT场景中,用户对离线、实时、安全的AI需求日益迫切。腾讯混元推出的HY-1.8B-2Bit,正是瞄准这一行业痛点,通过极致压缩与优化,首次将产业级2Bit大模型部署到手机等边缘设备上,为端侧智能普及带来新可能。

HY-1.8B-2Bit是什么

HY-1.8B-2Bit是腾讯混元推出的首个产业级2Bit端侧大模型,模型基于1.8B模型经量化感知训练(QAT)压缩推出。HY-1.8B-2Bit等效参数量仅0.3B,大小仅300MB,内存占用600MB,比常用手机应用还小。在保持原模型全思考能力的同时,生成速度提升2-3倍,已适配Arm SME2等移动平台,可在手机、耳机、智能家居等边缘设备上高效运行,实现”小而强”的端侧AI部署突破。

阅读目录
  • HY-1.8B-2Bit是什么
  • HY-1.8B-2Bit的主要功能
  • HY-1.8B-2Bit的技术原理
  • HY-1.8B-2Bit的项目地址
  • HY-1.8B-2Bit的应用场景
      • 📝 站长洞察 (Editor’s Insight)

HY-1.8B-2Bit

HY-1.8B-2Bit的主要功能

  • 端侧智能推理:模型支持在手机、耳机、智能家居等消费级硬件上离线部署运行大语言模型,无需依赖云端服务。
  • 全思考能力:沿用原模型的长短思维链灵活切换机制,根据任务复杂度自动选择简洁或详细的推理路径。
  • 高效文本生成:在真实端侧设备上相比原始精度模型实现2-3倍的生成速度提升,大幅降低用户等待时间。
  • 隐私安全保护:模型完全本地运行确保用户数据不出设备,满足离线部署和高私密性场景的安全需求。

HY-1.8B-2Bit的技术原理

  • 量化感知训练(QAT):不同于传统训练后量化(PTQ)在模型训练完成后直接压缩带来的巨大精度损失,QAT在训练过程中就模拟2Bit量化的前向传播效应,使模型权重主动适应低精度约束,显著恢复量化后的模型性能。
  • 2Bit极端压缩与等效降参:通过将32位浮点权重压缩至2Bit表示(仅4种离散状态),模型实际大小从原1.8B参数的GB级降至300MB,等效参数量仅0.3B,实现6倍存储压缩比,同时保持与4Bit PTQ相当的数学、代码和科学推理能力。
  • 数据与训练策略优化:采用数据优化、弹性拉伸量化及训练策略创新三种方法协同提升模型全科能力,其中弹性拉伸量化通过动态调整权重分布的量化范围,最大限度减少极端值带来的精度损失。
  • 端侧硬件适配:提供GGUF-INT2格式权重与BF16伪量化权重,针对Arm SME2指令集进行深度优化,使模型能在启用该技术的移动设备上实现高效稳定推理。

HY-1.8B-2Bit的项目地址

  • GitHub仓库:https://github.com/Tencent/AngelSlim
  • HuggingFace模型库:
    • https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF
    • https://huggingface.co/AngelSlim/HY-1.8B-2Bit
  • 技术论文:https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

HY-1.8B-2Bit的应用场景

  • 智能手机助手:作为内置AI助手实现离线语音交互、文本生成和智能问答,无需联网即可处理日程管理、邮件起草等日常任务,保护用户隐私的同时降低流量消耗。
  • 智能穿戴设备:模型能部署于智能耳机、手表等低功耗设备,支持离线语音转文字、实时翻译和健康咨询,解决穿戴设备算力受限和续航敏感的痛点。
  • 智能家居中控:在智能音箱、家电控制器等IoT设备上本地运行,实现离线语音指令识别、场景联动控制和个性化推荐,提升响应速度并保障家庭数据安全。
  • 车载边缘计算:应用在车机系统和自动驾驶辅助设备,确保网络不稳定场景下的服务连续性。
  • 企业私有化部署:模型能满足金融、医疗、政务等对数据合规要求极高的行业,在本地服务器或专用终端上实现敏感文档处理、专业知识问答,杜绝数据外传风险。

📝 站长洞察 (Editor’s Insight)

HY-1.8B-2Bit的发布标志着大模型‘下沉’到终端设备的关键一步。其核心突破在于,采用量化感知训练(QAT)而非传统后量化,在训练阶段就使模型适应2Bit的极端压缩,从而在300MB的体积下保持了接近原模型的推理能力。这解决了端侧模型‘小模型能力弱’的长期难题。结合Arm SME2的硬件适配,它让手机、IoT设备首次能高效运行具备‘长短思维链’的复杂推理。这不仅是腾讯在模型压缩工程上的领先,更预示了AI计算范式的转变:从依赖云端的‘重AI’,转向端云协同的‘轻智能’。未来,随着5G-A/6G和专用NPU的普及,此类端侧模型将催生更丰富、更安全的本地化AI应用,彻底改变人机交互与数据处理的隐私边界。

百度PP-OCRv5发布:0.07亿参数,40+语言识别,CPU每秒处理370+字符的轻量级OCR模型
Dog Identifier狗狗品种识别器
Photo AI头像
美团开源LongCat-Image:6B参数逼平闭源模型,8105汉字渲染+图像编辑全搞定
STAR – 南大、字节、西南大学联合开源的现实世界视频超分辨率框架
TAGGED:模型量化端侧AI腾讯混元边缘计算
分享
Email 复制链接 打印
Share
上一篇 开源AI女友Clawra来了!基于OpenClaw,一键部署、自拍生成、深度定制,重新定义虚拟伴侣
下一篇 阿里通义千问发布Qwen-Image-2.0:7B参数原生2K,1K长指令精准文字渲染,AI图像生成新标杆
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

流光脑波AI大脑占位特色图
2026年3月美国AI榜单巨变:Claude单月狂飙130%紧追ChatGPT,格局突变信号已现
AIGC 资讯 最新趋势
得物实战揭秘:AI Coding工具如何突破数仓开发’失忆’痛点,Harness工程引领新范式
AI 工具 AIGC 资讯
全息流体渐变通用占位特色图
历史性和解!Meta妥协规避审判,美国首例学校诉社交媒体成瘾案落幕,揭示行业司法风向
AIGC 资讯
量子芯片科技感占位特色图
Spotify与环球音乐联手:AI翻唱混音工具上线,正版版权终结Suno野蛮生长
AI 工具 AIGC 资讯 最新趋势

相关推荐

AI 工具AIGC 资讯

上海AI Lab开源Lumina-DiMOO:全离散扩散统一多模态生成理解,刷新行业基准

站外新闻
AIGC Lumina-DiMOO 上海人工智能实验室 多模态大模型 扩散模型
AI 工具AIGC 资讯

GPT-5.4重磅发布:OpenAI旗舰AI模型集成电脑操作与深度搜索,专业工作性能首超人类

站外新闻
AI Agent GPT-5.4 openai 计算机操作
AI 工具AIGC 资讯

字节Seed Diffusion模型:代码生成速度飙升5.4倍,扩散语言模型技术深度解析

站外新闻
AIGC Seed Diffusion 代码生成 字节跳动 扩散语言模型
AIGC 资讯

DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI模型 AI绘画 AI编程 AI编程助手 AI编程工具 AI视频生成 AI音乐生成 Anthropic Cerebras WSE-3 chatgpt Claude Claude Code DeepSeek Gemini GPT-5.3 Instant GPT-5.3-Codex-Spark GPT-5.4 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 openai prompt Qwen3 RAG SWE-Bench xAI 上海人工智能实验室 世界模型 人工智能 人物 代码生成 企业级AI 全模态大模型 具身智能 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 多模态模型 大模型 大模型应用 大语言模型 字节跳动 小红书 展台 开源 开源AI 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 扩散模型 推理模型 教程 数字人 文本转语音 早报 昆仑万维 智谱AI 月之暗面 本地部署 清华大学 生成式AI 知识管理 美团 腾讯混元 自然语言处理 英伟达 蚂蚁集团 视觉语言模型 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 谷歌DeepMind 轻量级模型 通义千问 阶跃星辰 阿里巴巴 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.