
生成式AI崛起,开源翻译模型的竞争也更为剧烈,紧随OpenAI推出ChantGPT Translate,Google也推出了全新TranslateGemma。翻译模型基于Gemma 3构建,涵盖55种语言,提供4B、12B及27B三种参数,帮助用家跨越语言障碍。
Google表示,已针对55 种语言严谨训练TranslateGemma,涵盖主要语言以及低资源语言,与Gemma 基础版模型相比,TranslateGemma 在所有语言中的错误率均显著降低。同时,Google将就著近500种语言训练TranslateGemma,让研究人员以TranslateGemma为基础平台,针对特定语言训练出尖端模型。
以低参数实现高吞吐
评测上,新模型的表现也颇为出色。在WMT24++基准测试中,以MetricX指标衡量,TranslateGemma 12B版本表现超越Gemma 3 27B模型。换言之,只需使用基础版Gemma的一半参数,即可实现更高吞吐量,以及更低迟延。
另外,在Vistra 图像翻译基准测试中,即使TranslateGemma并未进行多模态微调,其在图像内翻译文字的表现依然有所上升。
是次TranslateGemma性能得以提升,乃是得益于Google的两项微调流程。首先,Google利用监督式微调(SFT),运用丰富的人类翻译文本,以及Gemini模型生成的高质素翻译调整基础Gemma 3模型。其次是,Google透过强化学习(RL),结合多个奖励模型,使Gemma 3的翻译更自然流畅。
TranslateGemma已经开放使用,所有用户均可在Kaggle和于 Hugging Face平台下载体验,或者进行二次开发。
今日热搜
查看更多



