AI洞察 | Hunyuan-MT 翻译模型开源,谷歌终端嵌入模型登场

229 阅读5分钟

欢迎关注微信公众号:科技洞察者 📌

腾讯混元翻译模型:小巧身躯,卓越性能

腾讯近日正式开源了其混元翻译模型 Hunyuan-MT-7B,这款参数量仅为 7 亿的轻量级模型,却在全球机器翻译领域展现出惊人的实力。

Hunyuan-MT 技术细节.png

性能超群,多语种覆盖

Hunyuan-MT-7B 在国际计算语言学协会(ACL)WMT2025 比赛中脱颖而出,在 31 种语言对的翻译任务中斩获了 30 项第一,超越了众多参数更大的竞争对手,充分证明了其卓越的性能。

Hunyuan-MT WMT2025 成绩.jpg

它不仅支持 33 种主流语言的互译,更令人惊喜的是,它还能准确快速地翻译 5 种中国民族语言及方言,甚至能应对俚语、古诗以及社交对话中的缩写等复杂文本,展现出大模型对语境和上下文的深刻理解能力。

image.png

高效部署,生态开放

除了强大的翻译效果,Hunyuan-MT-7B 在计算效率和部署友好性方面也表现出色。

Hunyuan-MT overall_performance.png

得益于腾讯自研的 AngelSlim 大模型压缩工具,其推理性能提升了 30%,实现了更快的响应速度。

Hunyuan-MT AngelSlim.png

同时,腾讯还推出了 Hunyuan-MT-Chimera-7B 翻译集成模型,能够整合不同翻译模型的译文,为专业翻译场景提供更优质的输出。

目前,混元翻译模型已深度融入腾讯会议、企业微信、QQ 浏览器等多个核心业务,显著提升了用户体验。腾讯表示,未来将继续开放更多模型和技术,携手社区共同构建开放的大模型生态。

Hunyuan-MT Banner.png

Hunyuan-MT-7B 目前已在官网、GitHub 和 HuggingFace 等平台全面开源,开发者可轻松获取。

官网:hunyuan.tencent.com/llm/zh?tabI…

模型列表:hunyuan.tencent.com/modelSquare…

技术报告:github.com/Tencent-Hun…

GitHub:github.com/Tencent-Hun…

HugginFace:huggingface.co/collections…

AngelSlim压缩工具:github.com/Tencent/Ang…

Google EmbeddingGemma:设备端 AI 的未来

谷歌近日发布了全新的 EmbeddingGemma 模型,这是一款高性能、低资源消耗且可在本地设备上离线运行的开源嵌入模型,旨在重新定义设备端 AI 的应用边界。

轻量高效,隐私优先

EmbeddingGemma 的核心优势在于其能够在手机、笔记本等本地设备上高效运行,有效解决了传统云端嵌入模型在数据隐私、网络依赖和高资源占用方面的问题。

image.png

它能将文本转化为数字向量,帮助机器更好地理解和搜索信息。这款模型体积小巧,量化后内存占用低于 200MB,但性能却不逊色于更大的模型。

EmbeddingGemma 模型大小.png

它支持 768 到 128 维度的可变向量输出(Matryoshka Representation Learning),上下文长度达 2K tokens,并在 EdgeTPU 上实现了低于 15 毫秒的嵌入推理时间(256 tokens),真正做到了轻量与高效并存。

应用广泛,无缝集成

EmbeddingGemma 的应用场景极为广泛,包括离线文件搜索、构建离线聊天机器人、语义搜索、检索增强生成(RAG)、文本分类和聚类等。

image.png

它还支持微调,以适应特定的任务或语言需求。该模型在多语言能力上表现出色,支持 100 多种语言,并在 Massive Text Embedding Benchmark (MTEB) 多语言评估中优于同体积模型,能生成高质量的语义嵌入,这对于 RAG 的召回精度至关重要。

EmbeddingGemma MTEB评估.png

Google 将其定位为设备端应用的首选,以优化隐私、安全和效率,而大规模服务端应用则推荐使用 Gemini Embedding。

EmbeddingGemma 与其他模型对比.png

EmbeddingGemma 模型已在 Hugging Face、Kaggle 和 Vertex AI 上开放下载,为开发者提供了极大的便利。

官方介绍:developers.googleblog.com/en/introduc…

HuggingFace:huggingface.co/collections…

Kaggle:www.kaggle.com/models/goog…

Vertex AI:console.cloud.google.com/vertex-ai/p…

Google Gemini CLI GitHub Actions:AI 赋能开源协作

谷歌再次为开发者社区带来福音,推出了 Gemini CLI GitHub Actions,将强大的 Gemini AI 编码能力直接集成到 GitHub 仓库中,旨在大幅提升开发者的效率和协作体验。

免费普惠,提升效率

与市面上一些付费的 AI 辅助编码服务不同,谷歌的这项服务完全免费,这无疑大大降低了开源开发者、小型团队和企业使用 AI 的门槛。

Gemini CLI GitHub Actions All-Three_1.width-1200.jpg

该集成基于今年早些时候发布的 Gemini CLI(需 0.1.18 或更高版本),利用了谷歌强大的 Gemini 2.5 Pro 模型,该模型支持百万级令牌上下文窗口,并采用开源许可,确保了其开放性和可访问性。

智能协作,简化流程

通过 GitHub Actions,Gemini 从一个终端编码助手转变为一个强大的协作伙伴,能够深度参与到 GitHub 仓库的日常维护中。

image.png

其核心功能包括:自动分类和优先排序新提交的问题,显著减少人工管理待办事项的时间;以及由 AI 驱动的拉取请求(PR)审核,在人类开发者介入前,自动检查代码风格、潜在 bug 和正确性。

image.png

开发者只需在 GitHub 评论中提及@gemini-cli并使用/review/triage等命令,即可实现与 Gemini 的按需协作互动。

image.png

集成过程也十分简便,开发者可以通过运行/setup-github命令来自动生成必要的工作流文件。

认证方面,谷歌提供了 API 密钥认证和更安全的适用于企业用户的“工作负载身份联合”(WIF)认证。

Gemini CLI GitHub Actions 的发布标志着谷歌在推动 AI 与协作软件开发结合方面迈出了重要一步,通过免费、灵活配置和强安全措施,降低了团队在其仓库中尝试 AI 驱动自动化的门槛。

官方介绍:blog.google/technology/…

配额:github.com/google-gemi…

GitHub:github.com/google-gith…

如果对你有帮助的话,请点赞、分享。关注微信公众号 科技洞察者,第一时间获取 前沿科技讯息,还有 数字人播客、演示视频 等丰富内容,我们下期再见。