💡 站外导读:在全球化协作与移动办公成为常态的今天,高质量的跨语言沟通仍是痛点。传统翻译工具在专业领域术语不准、网络依赖强、隐私保护弱,且难以满足个性化风格需求。腾讯混元此次开源 Hy-MT2,旨在以多尺寸模型架构覆盖从云端到端侧的全场景翻译,特别是通过极端量化技术将高性能模型压缩至手机可运行的 440MB,直击离线与隐私敏感场景,标志着开源翻译大模型在性能、轻量化与实用性上迈入新阶段。
Hy-MT2是什么
Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。其中 7B 和 30B-A3B 在多项评测中达到开源模型最佳效果,超越数十倍参数量模型;1.8B 轻量版经 1.25-bit 极端量化后仅 440MB,可部署在手机端本地推理。
阅读目录

Hy-MT2的主要功能
-
多语言互译:支持 33 种语言互译及 5 种民汉/方言翻译,覆盖全球主流语种与国内少数民族语言。
-
语音输入翻译:小程序内置语音输入功能,用户可通过说话直接完成跨语言翻译。
-
自定义翻译风格:支持设定术语、输出格式、精简程度等个性化指令,让翻译结果更符合预期。
-
端侧离线翻译:1.8B 模型经 1.25-bit 量化后仅 440MB,可下载至手机在无网络环境下本地推理。
-
单词解析与对比:提供单词释义解析及不同风格翻译结果对比,帮助用户理解词汇用法差异。
Hy-MT2的技术原理
-
多尺寸模型架构:提供 1.8B、7B 和 30B-A3B 三种规格,分别面向端侧轻量、云端高效及高精度翻译场景。
-
AngelSlim 极端量化:采用 1.25-bit 量化技术将 1.8B 模型压缩至 440MB,实现手机芯片上的低资源本地部署。
-
多场景联合训练:基于大规模多语言语料统一训练,在通用翻译、专业领域和真实业务场景中均衡优化模型能力。
-
指令遵循强化:针对翻译任务专门优化指令理解能力,使模型能准确执行风格变换、术语约束等复杂用户要求。
如何使用Hy-MT2
- 在线体验
-
打开小程序:微信搜索并打开腾讯 Hy 翻译小程序。
-
输入待译内容:选择源语言与目标语言,输入文字或点击语音按钮进行语音输入。
-
自定义翻译风格:点击个性化设置,自定义翻译风格、术语偏好或格式要求等指令。
-
查看翻译结果:查看翻译结果,可切换不同风格对比或点击单词查看详细解析。
-
- 离线使用
-
下载端侧模型:在小程序设置中下载 1.8B 端侧翻译模型到本地。
-
启用离线模式:等待模型下载完成后,即可在无网络或弱网络环境下使用离线翻译。
-
本地推理翻译:离线状态下输入文字,模型将在手机本地完成推理并输出翻译结果。
-
- 开源模型部署
-
获取开源模型:访问 GitHub 或 HuggingFace 获取 Hy-MT2 开源模型(1.8B / 7B / 30B-A3B)。
-
选择模型尺寸:根据硬件条件选择对应尺寸模型,1.8B 量化版仅需约 440MB 存储空间。
-
配置推理环境:按照开源文档配置推理环境,可在本地服务器或终端设备上部署使用。
-
Hy-MT2的核心优势
-
性能超越大模型:7B 和 30B-A3B 在 FLORES-200 等评测中超越 DeepSeek-V4-Pro 和 Kimi K2.6,30B-A3B 在真实场景和专业领域超过 Gemini 3.1 Pro。
-
端侧部署极致轻量:1.8B 模型量化后仅需 440MB 存储,可在苹果、高通、联发科等手机芯片上流畅运行,推理速度较上一代提升 1.5 倍。
-
翻译指令遵循领先:在 IFMTBench 指令遵循测试集上表现优异,能精准执行风格变换、指定术语翻译等复杂指令。
-
专业领域深度优化:针对金融、法律、医疗、教育等 8 大专业领域深度调优,GEMBA 评分接近或超越主流商业 API。
Hy-MT2的项目地址
- 项目官网:https://aistudio.tencent.com/llm/en?tabIndex=0
- GitHub仓库:https://github.com/Tencent-Hunyuan/Hy-MT2
- HuggingFace模型库:https://huggingface.co/collections/tencent/hy-mt2
Hy-MT2的同类竞品对比
| 对比维度 | Hy-MT2 | GPT-Realtime-Translate |
|---|---|---|
| 模型定位 | 开源文本翻译大模型,专注高质量多语言翻译 | 闭源实时语音翻译专用模型,专注低延迟语音互译 |
| 发布方 | 腾讯混元 | OpenAI |
| 参数规模 | 1.8B / 7B / 30B-A3B 三档可选 | 未公开 |
| 语言覆盖 | 33 种语言互译 + 5 种民汉/方言 | 70+ 输入语言 → 13 输出语言 |
| 输入形式 | 文本输入 + 语音输入(小程序) | 实时语音流(24 kHz PCM16) |
| 输出形式 | 文本翻译结果 + 单词解析 | 实时翻译语音 + 文本字幕 |
| 延迟表现 | 云端推理快,端侧本地推理 | 亚秒级延迟(约 0.8s) |
| 端侧部署 | 1.8B 量化后 440MB,可手机本地运行 | 不支持,仅云端 API |
| 离线使用 | 支持下载模型后无网络离线翻译 | 不支持,必须联网调用 API |
Hy-MT2的应用场景
-
日常跨语言沟通:模型适用旅游、社交等场景下的 33 种语言实时互译。
-
专业文档翻译:模型能满足金融、法律、医疗、教育等 8 大垂直领域的精准翻译需求。
-
离线翻译场景:在无网络或弱网络环境下,通过手机端侧模型实现本地离线翻译。
-
个性化内容创作:模型支持自定义翻译风格,辅助自媒体、学术写作等特定表达需求。
-
商务办公辅助:支持语音输入与文档翻译,提升跨国商务沟通与会议记录效率。
📝 站长洞察 (Editor’s Insight)
Hy-MT2 的发布是开源翻译领域一次重要的「以小博大」实践。其核心启示在于:1)模型效能比(参数效率)的重要性已超越单纯规模竞赛,7B 模型在主流评测中超越数十倍参数的模型,印证了数据质量与训练方法的关键性;2)1.25-bit 极端量化实现端侧部署,是推动 AI 从云端走向边缘的关键技术突破,为未来隐私优先、离线可用的本地化 AI 应用铺平了道路;3)开源策略与丰富的指令遵循能力,使其不仅能用于基础翻译,更可能催生大量垂直行业与个性化应用的创新。这不仅是腾讯在 AI 工具层的一次有力布局,也预示着轻量化、高定制、离线可用的端侧大模型将成为下一阶段竞争的关键战场。
