腾讯手机端翻译模型开源了,无需联网离线运行,仅0.4G,支持33种语言

91 阅读5分钟

大家好,我是小悟。

五一黄金周,祝大家节日快乐。

就在假期前两天,腾讯公布开源了一款翻译大模型Hy-MT1.5-1.8B-1.25bit,能装在手机里面运行,离线也能用。除了平常用到,对这次有出国旅游的小伙伴或许更是一场及时雨。

图片

Hy-MT1.5-1.8B-1.25bit 是什么

简单说,就是腾讯混元团队用了一套叫 Sherry 的 1.25-bit 稀疏三值量化技术,把那个表现很好的 Hy-MT1.5(1.8B 参数)翻译大模型,“瘦身”出来的手机版。

AngelSlim architecture

原版 1.8B 要是按标准精度存,得占 3.3GB 内存,手机根本扛不住。他们搞的这个技术,大概是每 4 个参数里,挑 3 个重要的用 1-bit 存,剩下 1 个直接归零,算下来平均每个参数只占了 1.25 个比特。

就这么个操作,把原本庞大的模型压到了 440MB(0.4G),但这底子的翻译能力基本没丢,专门是为了能塞进普通手机的存储和内存里设计的。

图片

解决痛点

平时拿手机翻点东西,最怕两种情况。一是在飞机上、地下车库或者国外没插卡的时候,那些靠云的翻译软件直接就废了,转圈转到心累。

二是有些带点敏感信息的合同、邮件,往公开服务器上传总觉得不太踏实,怕留痕,也费流量。

这个模型就能解决这种问题。440MB 的大小,下到手机里就一直在本地待命,治好了依赖网络的毛病。

不管是在没信号的环境还是处理内部资料,点开就翻,速度跟手,也不用担心那点隐私数据往外跑,更没有那些乱七八糟的订阅费,属于一次下载,长久省心。

图片

核心功能

全离线多语互译:别看体积小,肚子里有的是货。33 种主流语言(中英日法德俄等)外加 5 种国内方言(藏、蒙、维等),任意两两互译,一共 1056 个方向,不联网照样转。

全局后台取词:这个很实用。在别的应用里(比如看邮件、刷网页)长按选词,菜单里会多一个“离线翻译”,点一下就弹个悬浮窗给结果,不用反复切屏,也不用来回复制粘贴。

demo2

极速轻量常驻:440MB 的身材,对现在随便 128G 起步的手机来说不算啥,配上 STQ 推理内核(适配手机 CPU 的 SIMD 指令)能一直扔在后台。

图片

Hy-MT1.5-1.8B 翻译效果评分

质量方面不用担心被“压缩”废了。它的底子 Hy-MT1.5-1.8B 本来就很硬,在 Flores-200 这种严酷的测试里,得分能逼近那些几千亿参数的巨无霸,比谷歌翻译这些老牌 API 还要稳一点。

这个 1.25bit 的压缩版,虽然为了体积牺牲了一点精度,但完全在可控范围内。日常用起来,不会出现那种翻出来全是碎片的尴尬,拿来应对旅行、日常办公完全够用,甚至有点超出预期。

图片

如何部署

要是你想在服务器或者自己电脑上跑着玩,用 Hugging Face 的库加载挺省事。给个最基础的 Python 调用例子:

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

# 填你自己的模型路径
model_path = "AngelSlim/Hy-MT1.5-1.8B-1.25bit"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForSeq2SeqLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True)

text = "The offline translation capability of this model is quite impressive."
inputs = tokenizer(f"translate English to Chinese: {text}", return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

当然,大多数人是想直接在手机上用。目前官方给了安卓的 Demo APK,支持端侧直接跑,不需要你自己去搭环境,装上就能选模型加载。

体验 demo

Huggingface(海外用户):https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk
魔搭社区(国内用户):https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk

安装完打开,第一次会自己下那个 440MB 的模型包(所以第一次得有网),进度条走完就好了。

主界面直接输文本翻译,底部能换语言方向。如果想试试后台取词,去手机设置里开一下悬浮窗权限,然后去随便一个文档里选几个洋文单词,点更多里找“离线翻译”。

图片

为什么推荐它

个人觉得,很多人认为大模型参数越大越好,非得堆到云端去算。腾讯混元这个操作,反而是把重心放回了“端侧”,放回了咱们普通用户的手机上。

它不光是开源那么简单,关键是它真的把一个高性能的专业翻译工具,变成了一个普通手机能轻松承载的 0.4G 小文件,还保持了很高的水准。

对于做出海 App 的开发者、经常跑野外的商务,或者就是单纯注重隐私不想联网的人,这都是一个很扎实、很落地的选择。

图片

最后

技术到最后,还是得看能不能融入生活,解决那些没网时的尴尬,或者打消那点数据安全的顾虑。

腾讯混元把这个仅 0.4G 的翻译模型开源出来,不管是拿来直接用,还是去研究下那个 Sherry 量化算法,都挺有料。

项目资料

1、Huggingface(海外用户):
2-bit模型权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模型gguf:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit模型权重:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit
1.25-bit 模型gguf:https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF

2、魔搭社区(国内用户):
2-bit 模型权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit
2-bit 模型gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF
1.25-bit 模型权重:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit
1.25-bit 模型gguf:https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF

3、技术报告:
Sherry论文地址:https://arxiv.org/abs/2601.07892
AngelSlim 技术报告:https://arxiv.org/abs/2602.21233Hy-MT1.5
技术报告:https://arxiv.org/abs/2512.24092

4、代码仓库:
AngelSlim: https://github.com/tencent/AngelSlim

图片

谢谢你看我的文章,既然看到这里了,如果觉得不错,随手点个赞、转发、在看三连吧,感谢感谢。那我们,下次再见。

您的一键三连,是我更新的最大动力,谢谢

山水有相逢,来日皆可期,谢谢阅读,我们再会

我手中的金箍棒,上能通天,下能探海