Google搜索正在升级,有望提高搜索引擎上结果的质量。
这项改进将有助于Google理解包含会话语言的查询,并使用诸如“ for”和“ to”之类的介词,这可以大大改变句子的含义。它还将帮助Google推断出语法错误的查询背后的意图。
该改进仅影响美国市场10%的英语搜索。尽管如此,谷歌副总裁潘都·纳亚克(Pandu Nayak)称其为“世界上最流行的搜索引擎的过去五年中最大的飞跃”。
他在周五的博客中写道:“借助我们的研究团队在语言理解科学方面的最新进展(通过机器学习使之成为可能),我们正在极大地改善我们理解查询的方式。”
过去,在破译某些查询的全部含义时,Google可能会感到困惑。例如,“ 2019年前往美国的巴西旅行者需要签证”。你永远不会和另一个人这样说话。但是人们最终可能会以这种方式向Google输入搜索查询,以强调他们希望公司算法能够理解的某些关键字。
不幸的是,这种方法并不总是有效。纳亚克说:“查询中的'to'一词及其与其他词的关系对于理解其含义尤其重要。“这是关于巴西人前往美国的事情,而不是相反。以前,我们的算法无法理解这种联系的重要性,我们返回了有关美国公民前往巴西的结果。
另一个示例包括“您能为某人药房买药吗”。用户试图找出您是否可以为其他人(例如家庭成员)开处方。但是过去,Google会忽略“为某人”一词,而只是返回填写医疗处方的一般结果。
因此,为解决该问题,该公司合并了一个名为BERT的新语言处理计算模型,该模型旨在专门了解句子周围的上下文。Nayak说,它是通过处理与同一句子中所有其他单词相关的单词来做到这一点的,而不是“一一对应地”。
因此,Google的搜索引擎应该更聪明地了解围绕您的搜索查询的细微差别。例如,如果您输入“在没有路缘的山上停车”,搜索引擎现在将优先考虑“没有路缘”一词。同时,在搜索“成人数学练习本”时,Google将意识到“成人”一词至关重要,并避免返回与“年轻人”相关的搜索结果。
Payak表示,BERT技术还可以改善对其他语言的搜索,包括韩语,印地语和葡萄牙语。不过,不要指望它是完美的。
他说:“即使有了BERT,我们也不一定总能做到这一点。如果您搜索'内布拉斯加州以南的州,'BERT最好的猜测是一个名为'South Nebraska的社区。”他补充说:“对语言的理解仍然是一个持续的挑战,这使我们有动力继续改进搜索。”