腾讯手机端翻译模型开源了，无需联网离线运行，仅0.4G，支持33种语言腾讯混元团队用了一套叫 Sherry 的 1.25

大家好，我是小悟。

五一黄金周，祝大家节日快乐。

就在假期前两天，腾讯公布开源了一款翻译大模型Hy-MT1.5-1.8B-1.25bit，能装在手机里面运行，离线也能用。除了平常用到，对这次有出国旅游的小伙伴或许更是一场及时雨。

Hy-MT1.5-1.8B-1.25bit 是什么

简单说，就是腾讯混元团队用了一套叫 Sherry 的 1.25-bit 稀疏三值量化技术，把那个表现很好的 Hy-MT1.5（1.8B 参数）翻译大模型，“瘦身”出来的手机版。

AngelSlim architecture

原版 1.8B 要是按标准精度存，得占 3.3GB 内存，手机根本扛不住。他们搞的这个技术，大概是每 4 个参数里，挑 3 个重要的用 1-bit 存，剩下 1 个直接归零，算下来平均每个参数只占了 1.25 个比特。

就这么个操作，把原本庞大的模型压到了 440MB（0.4G），但这底子的翻译能力基本没丢，专门是为了能塞进普通手机的存储和内存里设计的。

解决痛点

平时拿手机翻点东西，最怕两种情况。一是在飞机上、地下车库或者国外没插卡的时候，那些靠云的翻译软件直接就废了，转圈转到心累。

二是有些带点敏感信息的合同、邮件，往公开服务器上传总觉得不太踏实，怕留痕，也费流量。

这个模型就能解决这种问题。440MB 的大小，下到手机里就一直在本地待命，治好了依赖网络的毛病。

不管是在没信号的环境还是处理内部资料，点开就翻，速度跟手，也不用担心那点隐私数据往外跑，更没有那些乱七八糟的订阅费，属于一次下载，长久省心。

核心功能

全离线多语互译：别看体积小，肚子里有的是货。33 种主流语言（中英日法德俄等）外加 5 种国内方言（藏、蒙、维等），任意两两互译，一共 1056 个方向，不联网照样转。

全局后台取词：这个很实用。在别的应用里（比如看邮件、刷网页）长按选词，菜单里会多一个“离线翻译”，点一下就弹个悬浮窗给结果，不用反复切屏，也不用来回复制粘贴。

demo2

极速轻量常驻：440MB 的身材，对现在随便 128G 起步的手机来说不算啥，配上 STQ 推理内核（适配手机 CPU 的 SIMD 指令）能一直扔在后台。

Hy-MT1.5-1.8B 翻译效果评分

质量方面不用担心被“压缩”废了。它的底子 Hy-MT1.5-1.8B 本来就很硬，在 Flores-200 这种严酷的测试里，得分能逼近那些几千亿参数的巨无霸，比谷歌翻译这些老牌 API 还要稳一点。

这个 1.25bit 的压缩版，虽然为了体积牺牲了一点精度，但完全在可控范围内。日常用起来，不会出现那种翻出来全是碎片的尴尬，拿来应对旅行、日常办公完全够用，甚至有点超出预期。

如何部署

要是你想在服务器或者自己电脑上跑着玩，用 Hugging Face 的库加载挺省事。给个最基础的 Python 调用例子：

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

# 填你自己的模型路径
model_path = "AngelSlim/Hy-MT1.5-1.8B-1.25bit"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForSeq2SeqLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True)

text = "The offline translation capability of this model is quite impressive."
inputs = tokenizer(f"translate English to Chinese: {text}", return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

当然，大多数人是想直接在手机上用。目前官方给了安卓的 Demo APK，支持端侧直接跑，不需要你自己去搭环境，装上就能选模型加载。

体验 demo

Huggingface（海外用户）:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk
魔搭社区（国内用户）：https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk

安装完打开，第一次会自己下那个 440MB 的模型包（所以第一次得有网），进度条走完就好了。

主界面直接输文本翻译，底部能换语言方向。如果想试试后台取词，去手机设置里开一下悬浮窗权限，然后去随便一个文档里选几个洋文单词，点更多里找“离线翻译”。

为什么推荐它

个人觉得，很多人认为大模型参数越大越好，非得堆到云端去算。腾讯混元这个操作，反而是把重心放回了“端侧”，放回了咱们普通用户的手机上。

它不光是开源那么简单，关键是它真的把一个高性能的专业翻译工具，变成了一个普通手机能轻松承载的 0.4G 小文件，还保持了很高的水准。

对于做出海 App 的开发者、经常跑野外的商务，或者就是单纯注重隐私不想联网的人，这都是一个很扎实、很落地的选择。

最后

技术到最后，还是得看能不能融入生活，解决那些没网时的尴尬，或者打消那点数据安全的顾虑。

腾讯混元把这个仅 0.4G 的翻译模型开源出来，不管是拿来直接用，还是去研究下那个 Sherry 量化算法，都挺有料。

项目资料

1、Huggingface（海外用户）：
2-bit模型权重：https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模型gguf：https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit模型权重：https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit
1.25-bit 模型gguf：https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF

2、魔搭社区（国内用户）：
2-bit 模型权重：https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模型gguf：https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit 模型权重：https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit
1.25-bit 模型gguf：https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF

3、技术报告：
Sherry论文地址：https://arxiv.org/abs/2601.07892
AngelSlim 技术报告：https://arxiv.org/abs/2602.21233Hy-MT1.5
技术报告：https://arxiv.org/abs/2512.24092

4、代码仓库：
AngelSlim: https://github.com/tencent/AngelSlim

谢谢你看我的文章，既然看到这里了，如果觉得不错，随手点个赞、转发、在看三连吧，感谢感谢。那我们，下次再见。

您的一键三连，是我更新的最大动力，谢谢

山水有相逢，来日皆可期，谢谢阅读，我们再会

我手中的金箍棒，上能通天，下能探海