Root Nation消息资讯资讯Microsoft 声称开发了“最全面的拼写纠正系统”

Microsoft 声称开发了“最全面的拼写纠正系统”

公司 Microsoft 提出了一个名为 拼写100,可更正必应搜索中使用的 100 多种语言的拼写。

“我们相信 Speller100 是迄今为止在语言覆盖范围和准确性方面创建的最全面的拼写纠正系统,”该公司在一篇博文中表示。

Microsoft Speller100 改进的更正

以前,Bing 为大约两打语言提供了高质量的拼写更正。 然而,该系统没有足够的训练数据来在网络存在很少且用户反馈有限的语言中表现良好。

Microsoft Speller100 相似之处

Speller100 系统通过寻找大型语言家族之间的相似性来克服这些限制。 它还适用于“零射击训练”(ZSL - 零镜头学习) 纠正错误而不需要额外的训练数据。

Microsoft 解释

Microsoft 表示已经创建了大约十几种语言家族模型,以最大限度地发挥“零样本学习”的好处:

想象一下,有人教你用英语写作,你自然而然地学会了用德语、荷兰语、南非荷兰语、苏格兰语和卢森堡语写作。 这些是“零样本学习”赋予我们的能力,它是 Speller100 中的一个关键组成部分,它使我们能够在数据很少或没有数据的情况下扩展到语言。

该系统还通过从网页中提取文本来生成常见错误,从而减少了对人工注释的需求。

Microsoft Speller100 人工注释

“这样的文本可以通过扫描互联网轻松提取,并且足以教授数百种语言。” Microsoft.

在进行在线测试后,该公司报告了以下结果:

  • 没有结果的页面数量已减少到 30%。
  • 用户不得不手动重新制定查询的案例数量减少了 5%。
  • 用户点击拼写建议的次数从个位数增加到 67%。
  • 用户对页面上任何元素的点击次数从个位数增加到 70%。

Microsoft 表示,将Speller100系统集成到Bing中只是第一步。该公司计划在不久的将来将该技术添加到其“更多”产品中。

另请阅读:

Dzherelothenextweb
注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论
其他文章
订阅更新
现在流行