Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: 腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > 腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍
AI 工具AIGC 资讯

腾讯混元发布HY-1.8B-2Bit:首个产业级2Bit端侧大模型,手机运行仅需300MB,速度翻倍

站外新闻
最近更新: 2026年6月7日 下午8:07
模型量化 端侧AI 腾讯混元 边缘计算
SHARE

💡 站外导读:当前,大模型在云端运行面临隐私泄露、网络延迟和高功耗等挑战,尤其在移动和IoT场景中,用户对离线、实时、安全的AI需求日益迫切。腾讯混元推出的HY-1.8B-2Bit,正是瞄准这一行业痛点,通过极致压缩与优化,首次将产业级2Bit大模型部署到手机等边缘设备上,为端侧智能普及带来新可能。

HY-1.8B-2Bit是什么

HY-1.8B-2Bit是腾讯混元推出的首个产业级2Bit端侧大模型,模型基于1.8B模型经量化感知训练(QAT)压缩推出。HY-1.8B-2Bit等效参数量仅0.3B,大小仅300MB,内存占用600MB,比常用手机应用还小。在保持原模型全思考能力的同时,生成速度提升2-3倍,已适配Arm SME2等移动平台,可在手机、耳机、智能家居等边缘设备上高效运行,实现”小而强”的端侧AI部署突破。

阅读目录
  • HY-1.8B-2Bit是什么
  • HY-1.8B-2Bit的主要功能
  • HY-1.8B-2Bit的技术原理
  • HY-1.8B-2Bit的项目地址
  • HY-1.8B-2Bit的应用场景
      • 📝 站长洞察 (Editor’s Insight)

HY-1.8B-2Bit

HY-1.8B-2Bit的主要功能

  • 端侧智能推理:模型支持在手机、耳机、智能家居等消费级硬件上离线部署运行大语言模型,无需依赖云端服务。
  • 全思考能力:沿用原模型的长短思维链灵活切换机制,根据任务复杂度自动选择简洁或详细的推理路径。
  • 高效文本生成:在真实端侧设备上相比原始精度模型实现2-3倍的生成速度提升,大幅降低用户等待时间。
  • 隐私安全保护:模型完全本地运行确保用户数据不出设备,满足离线部署和高私密性场景的安全需求。

HY-1.8B-2Bit的技术原理

  • 量化感知训练(QAT):不同于传统训练后量化(PTQ)在模型训练完成后直接压缩带来的巨大精度损失,QAT在训练过程中就模拟2Bit量化的前向传播效应,使模型权重主动适应低精度约束,显著恢复量化后的模型性能。
  • 2Bit极端压缩与等效降参:通过将32位浮点权重压缩至2Bit表示(仅4种离散状态),模型实际大小从原1.8B参数的GB级降至300MB,等效参数量仅0.3B,实现6倍存储压缩比,同时保持与4Bit PTQ相当的数学、代码和科学推理能力。
  • 数据与训练策略优化:采用数据优化、弹性拉伸量化及训练策略创新三种方法协同提升模型全科能力,其中弹性拉伸量化通过动态调整权重分布的量化范围,最大限度减少极端值带来的精度损失。
  • 端侧硬件适配:提供GGUF-INT2格式权重与BF16伪量化权重,针对Arm SME2指令集进行深度优化,使模型能在启用该技术的移动设备上实现高效稳定推理。

HY-1.8B-2Bit的项目地址

  • GitHub仓库:https://github.com/Tencent/AngelSlim
  • HuggingFace模型库:
    • https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF
    • https://huggingface.co/AngelSlim/HY-1.8B-2Bit
  • 技术论文:https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

HY-1.8B-2Bit的应用场景

  • 智能手机助手:作为内置AI助手实现离线语音交互、文本生成和智能问答,无需联网即可处理日程管理、邮件起草等日常任务,保护用户隐私的同时降低流量消耗。
  • 智能穿戴设备:模型能部署于智能耳机、手表等低功耗设备,支持离线语音转文字、实时翻译和健康咨询,解决穿戴设备算力受限和续航敏感的痛点。
  • 智能家居中控:在智能音箱、家电控制器等IoT设备上本地运行,实现离线语音指令识别、场景联动控制和个性化推荐,提升响应速度并保障家庭数据安全。
  • 车载边缘计算:应用在车机系统和自动驾驶辅助设备,确保网络不稳定场景下的服务连续性。
  • 企业私有化部署:模型能满足金融、医疗、政务等对数据合规要求极高的行业,在本地服务器或专用终端上实现敏感文档处理、专业知识问答,杜绝数据外传风险。

📝 站长洞察 (Editor’s Insight)

HY-1.8B-2Bit的发布标志着大模型‘下沉’到终端设备的关键一步。其核心突破在于,采用量化感知训练(QAT)而非传统后量化,在训练阶段就使模型适应2Bit的极端压缩,从而在300MB的体积下保持了接近原模型的推理能力。这解决了端侧模型‘小模型能力弱’的长期难题。结合Arm SME2的硬件适配,它让手机、IoT设备首次能高效运行具备‘长短思维链’的复杂推理。这不仅是腾讯在模型压缩工程上的领先,更预示了AI计算范式的转变:从依赖云端的‘重AI’,转向端云协同的‘轻智能’。未来,随着5G-A/6G和专用NPU的普及,此类端侧模型将催生更丰富、更安全的本地化AI应用,彻底改变人机交互与数据处理的隐私边界。

月之暗面 Kimi K2.6 开源旗舰模型发布:性能对标GPT-5.4,支持300个Agent并行协作与5天自主运行
Jigso Sidekick
日日新SenseNova V6 – 商汤推出的多模态融合模型系列
MOCR:3B参数开源文档解析模型,图形重建能力超越Gemini 3 Pro
YC总裁亲测开源GBrain:打造AI Agent永生记忆,万级文件知识图谱实战解析
TAGGED:模型量化端侧AI腾讯混元边缘计算
分享
Email 复制链接 打印
Share
上一篇 RynnBrain:阿里达摩院开源具身智能大脑,SOTA级时空记忆+物理推理,机器人落地新范式
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

RynnBrain:阿里达摩院开源具身智能大脑,SOTA级时空记忆+物理推理,机器人落地新范式
AI 工具 AIGC 资讯
小红书开源OpenStoryline:首个具备导演思维的视频剪辑Agent,自然语言对话实现全流程AI创作
AI 工具 AIGC 资讯
Composer 1.5:Cursor自研AI编程模型深度解析——强化学习规模扩大20倍,重新定义智能编码体验
AI 工具
科大讯飞发布讯飞星火X2:国产算力赋能,数学推理与多语言能力比肩国际顶尖
AI 工具 AIGC 资讯

相关推荐

AIGC 资讯

QwQ-Max – 阿里推出的深度推理模型,基于 Qwen2.5-Max

站外新闻
AI 工具

Artificial Studio

remaker
AI 工具

Codeium

remaker
AI 工具AIGC 资讯

大晓机器人Kairos 3.0-4B开源:全球首个端侧具身世界模型,推理速度提升72倍!

站外新闻
世界模型 具身智能 大晓机器人 机器人控制 端侧部署
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax Mistral AI MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 小红书 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 本地AI 海报设计 清华大学 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 腾讯 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 阶跃星辰 阿里通义 阿里通义千问 面壁智能 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.