新式AI东西可翻译200种言语

来源:m6米乐备用网址    发布时间:2024-09-11 15:21:13 浏览次数: 1

  人类有超越7000种言语,这中心还包含运用人数不多、有关的材料稀疏的“小众言语”。美国“元”公司新研制的一个人工智能模型,能翻译200种不同言语,完成了对较多“小众言语”在线翻译。

  人工智能翻译现在多运用根据人工神经网络的模型翻译各种言语。这些模型常常要很多可在线获取的练习数据。不过,有些特定言语的数据尚不能揭露和低成本获取或遍及可及,这类言语又被称为“低资源言语”。

  “元”公司团队新研制的一种跨言语技能,能让根据人工神经网络的翻译模型学习怎么样运用已有的翻译高资源言语的才能来翻译低资源言语。团队运用该技能开发了一个名为NLLB-200的在线多言语翻译东西,可包容200种言语,其能翻译的低资源言语的数量是高资源言语数量的3倍。这一研讨成果近期宣布在英国《天然》杂志上。

  因为研讨团队在许多低资源言语上只能获取1000至2000例样本,为扩展NLLB-200的练习数据量,他们运用一个言语识别系统发现了这些特定言语的更多实例。团队还从互联网存档中发掘这些言语与英语的双语文本数据,协助提高模型的翻译质量。

  研讨者称,该翻译东西可协助低资源言语运用者运用互联网等技能,且这一模型还可用于教育,协助这类人群获取更多图书和论文材料。不过研讨者也表明,这一东西的误译状况仍有或许呈现。