该公司宣布(在新窗口中打开)今年2月,它正在“构建一个新的高级AI模型,该模型可以从需要训练的示例更少的语言中学习,我们将使用它来实现数百种语言的专家级翻译,从阿斯图里亚斯语到卢干达语再到乌尔都语。”它被称为“NoLanguageLeftbehind”,其结果是一个名为NLLB-200的模型。
“将翻译质量与之前的AI研究进行比较时,NLLB-200的平均得分高出44%,”Meta说(在新窗口中打开).“对于一些非洲和印度语言,NLLB-200的翻译准确率提高了70%以上。”(该公司在另一篇博客文章中提供了更多关于它正在比较NLLB-200的模型的信息(在新窗口中打开).)
Meta表示,NLLB-200所支持的改进翻译“将支持每天在FacebookNewsFeed、Instagram和我们的其他平台上提供的超过250亿次翻译。”该模型可以“帮助发现有害内容和错误信息,保护选举的完整性,并遏制在线性剥削和人口贩运的情况(在新窗口中打开),“它说。
NLLB-200可以“帮助推进其他技术,例如构建能够在爪哇语和乌兹别克语等语言中运行良好的助手,或者创建系统来拍摄宝莱坞电影并添加斯瓦希里语或奥罗莫语的准确字幕,”Meta建议道。它还与WikimediaFoundation合作,因此该模型可以协助翻译Wikipedia文章。
Meta还认为NLLB-200对Metaverse至关重要。“随着元宇宙开始成形,”它说,“构建在更广泛的语言中运行良好的技术的能力将有助于在虚拟世界中实现沉浸式体验的民主化。”(对于那些买得起VR耳机、可以上网并想参与元界的人来说。)
演示_(在新窗口中打开)可通过Meta的网站获得NLLB-200的实际应用。它展示了用多种语言编写的故事,例如印度尼西亚语和米南加保语,然后允许访问者选择他们希望将这些故事翻译成什么语言。Meta也发布了(在新窗口中打开)一份研究论文,其中包含有关如何训练和评估NLLB-200的更多信息。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!