Google最新开源翻译模型精准翻译55种语言-紫荆网

Google最新开源翻译模型精准翻译55种语言

日期：2026-01-16 来源：hket 浏览量：字号：大中小

分享到

生成式AI崛起，开源翻译模型的竞争也更为剧烈，紧随OpenAI推出ChantGPT Translate，Google也推出了全新TranslateGemma。翻译模型基于Gemma 3构建，涵盖55种语言，提供4B、12B及27B三种参数，帮助用家跨越语言障碍。

Google表示，已针对55 种语言严谨训练TranslateGemma，涵盖主要语言以及低资源语言，与Gemma 基础版模型相比，TranslateGemma 在所有语言中的错误率均显著降低。同时，Google将就著近500种语言训练TranslateGemma，让研究人员以TranslateGemma为基础平台，针对特定语言训练出尖端模型。

以低参数实现高吞吐

评测上，新模型的表现也颇为出色。在WMT24++基准测试中，以MetricX指标衡量，TranslateGemma 12B版本表现超越Gemma 3 27B模型。换言之，只需使用基础版Gemma的一半参数，即可实现更高吞吐量，以及更低迟延。

另外，在Vistra 图像翻译基准测试中，即使TranslateGemma并未进行多模态微调，其在图像内翻译文字的表现依然有所上升。

是次TranslateGemma性能得以提升，乃是得益于Google的两项微调流程。首先，Google利用监督式微调（SFT），运用丰富的人类翻译文本，以及Gemini模型生成的高质素翻译调整基础Gemma 3模型。其次是，Google透过强化学习（RL），结合多个奖励模型，使Gemma 3的翻译更自然流畅。

TranslateGemma已经开放使用，所有用户均可在Kaggle和于 Hugging Face平台下载体验，或者进行二次开发。