Google最新开源翻译模型精准翻译55种语言-紫荆网

Google最新开源翻译模型精准翻译55种语言

日期:2026-01-16 来源:hket 浏览量: 字号:
分享到
用微信扫描二维码

生成式AI崛起,开源翻译模型的竞争也更为剧烈,紧随OpenAI推出ChantGPT Translate,Google也推出了全新TranslateGemma。翻译模型基于Gemma 3构建,涵盖55种语言,提供4B、12B及27B三种参数,帮助用家跨越语言障碍。

Google表示,已针对55 种语言严谨训练TranslateGemma,涵盖主要语言以及低资源语言,与Gemma 基础版模型相比,TranslateGemma 在所有语言中的错误率均显著降低。同时,Google将就著近500种语言训练TranslateGemma,让研究人员以TranslateGemma为基础平台,针对特定语言训练出尖端模型。

以低参数实现高吞吐

评测上,新模型的表现也颇为出色。在WMT24++基准测试中,以MetricX指标衡量,TranslateGemma 12B版本表现超越Gemma 3 27B模型。换言之,只需使用基础版Gemma的一半参数,即可实现更高吞吐量,以及更低迟延。

另外,在Vistra 图像翻译基准测试中,即使TranslateGemma并未进行多模态微调,其在图像内翻译文字的表现依然有所上升。

是次TranslateGemma性能得以提升,乃是得益于Google的两项微调流程。首先,Google利用监督式微调(SFT),运用丰富的人类翻译文本,以及Gemini模型生成的高质素翻译调整基础Gemma 3模型。其次是,Google透过强化学习(RL),结合多个奖励模型,使Gemma 3的翻译更自然流畅。

TranslateGemma已经开放使用,所有用户均可在Kaggle和于 Hugging Face平台下载体验,或者进行二次开发。

来源:hket

扫描二维码分享到手机

编辑:刘雨桐 校对:江心雨 监制:姚润泽
4月5日起中国内地航线燃油附加费将上调
紫荆时评|唱衰论调可休矣!
Token:完善全球数据治理的突破口
我国科研人员发现99个新物种
紫荆杂志
影响有影响力的人