当我们上次深入研究 Google BERT AI 的增长潜力时,它只影响了所有英语搜索的 10%。但谷歌从一开始就对 BERT 的扩张制定了非常雄心勃勃的计划;计划于 2019 年 12 月推出 70 种语言的 BERT。
现在,距 BERT 取得重大突破一年多了。现在是时候深入了解一下谷歌革命性的人工智能到底在多大程度上彻底改变了搜索。
记住……谁是 BERT?
尽管缩写 BERT(来自 Transformers 的双向编码器表示)背后的含义相当枯燥,但 BERT 被广泛认为是 Google 自2015 年推出RankBrain以来所做的最重要的搜索更新。
BERT 的目标是更好地理解日常语言。特别关注重要但通常不明 土耳其电话数据 确的介词(例如“from”和“to”),它们构成了语言的常见构建块,但众所周知,计算机很难掌握。
这是搜索“2019 巴西游客前往美国需要签证”。 “to”一词及其与查询中其他词的关系对于理解其含义尤为重要。这是关于一个巴西人去美国旅行的故事,而不是相反。以前,我们的算法无法理解这种关系的重要性,并且我们会返回有关美国公民前往巴西旅行的结果。借助 BERT,搜索能够捕捉这种细微差别,并知道非常常见的单词“实际上在这里发挥着重要作用,我们可以为该查询提供更相关的结果。
在同一篇文章中,谷歌提供了更多示例,说明 BERT 如何帮助捕获计算机以前无法像人类一样理解的语言的细微差别:
让我们看另一个问题:“美容师工作时经常站着吗”。以前,我们的系统采用通过将结果中的术语“stand-alone”与查询中的单词“stand”进行比较来匹配关键字的方法。但这并不是“立场”一词在特定上下文中的正确用法。另一方面,我们的 BERT 模型了解“站立”与工作的物理需求概念相关,并显示出更明智的答案。