搜索引擎如何回答问题

搜索引擎的主要目的是帮助用户完成一项任务。有时,该任务可能涉及获取复杂信息。因为,用户问一个问题只是为了找一个单一答案。

在这一章中,我们会了解搜索引擎如何确定查询属于哪个类别以及它们如何确定答案。

搜索引擎如何定义查询类型

第一步,了解用户所请求的信息。

搜索引擎将查询分类为Who、What、Where、When、Why和How查询。无论查询中是否包含这些特定单词,都可以进行此分类,

天气查询

所以,我们在这里看到的是两件事:

  • 谷歌已确定用户正在寻找问题的答案作为可能的主要意图。
  • 谷歌已经确定,如果这不是用户的主要意图,那么次要意图可能不同。

搜索引擎如何确定用户在上面的第二个示例中提出问题。在第一个示例中,搜索引擎如何推断用户正在寻找有关其所在位置的天气信息,而不是出现其他情况下。这里存在许多系统连接并提供数据来创建这个环境。它的核心依赖于以下内容:

规范查询

搜索引擎倾向于将查询视为具有单个响应的单个请求。当查询运行时,如果没有已知意图,或者当引擎可能想要测试他们的假设时,他们可以使用的方法之一是创建规范查询。

谷歌在 2016 年授予的名为“评估搜索查询的语义解释”的专利中概述了该过程:

谷歌查询分类

一个查询具有多种可能的含义。在专利中,他们概述了一个过程,通过该过程可以使用所有可能的解释来产生结果。简但来说,他们将为所有五个查询生成一个结果集。

他们会将来自查询 204a、204b、204c 和 204d 的结果与来自 202 的结果进行比较。来自 204 系列的与来自 202 的结果最接近的那个将被认为是可能的意图。

从目前的结果来看,似乎是204c赢了:

搜索查询分类评估

这将需要两轮这个过程。第一个选择电影意图,第二个选择电影结果。从这个页面点击搜索结果的人越少,结果就会被认为越成功,这在声明中的专利中有所概述:

使用搜索结果来评估不同的语义解释,其他数据源(例如点击数据、用户特定数据以及在生成搜索结果时使用的其他数据)都被考虑在内,而无需执行额外的分析。

相对于专利的上下文,这并不是说点击率是一个直接的指标。事实上,这句话更类似于John Mueller在回答有关 Google 使用用户指标的问题时的意思:

这是我们在数百万个不同的查询和数百万个不同的页面中看到的东西,一般来说,这个算法是朝着正确的方向发展,或者是这个算法正在朝着正确的方向发展。

这里也可以证明,Google不只是用它来判断单个结果的成功,而是用它们来判断整个 SERP布局的成功。

神经匹配

谷歌使用神经匹配来确定同义词。基本上,神经匹配是一个人工智能驱动的过程,让谷歌在一个非常高的层次理解同义词。

评估搜素结果查询

排名页面不包含“Strange”一词。关键字也没有进行堆积。搜索引擎的人工智能系统正在寻找一个非常复杂的同义词,以了解哪些信息将解决一个意图,即使没有特别要求。

情境相似之处

情境上下文发挥作用的示例和领域有很多,但最重要的是,我们需要考虑查询意图如何随情境条件而变化。上面我们提到了一项关于创建规范查询的系统的专利。该专利中包含了创建模板的想法,可用于其他类似查询以更快地启动流程的模板。因此,如果需要资源来确定当用户输入一个往往具有广泛上下文的单个词时,他们可能想要一个定义,他们可以应用更普遍的产生结果,例如:

搜索结果解释

另外一个案例是食物,如果搜索餐馆的人比搜索“pizza”之类的食谱的人多,那可以肯定地说他们会将其用作指标,并知道食品是否不遵循该模式,该模板适不适用。

种子集

在模板的基础上,搜索引擎可能还会使用种子数据集。它基于对人们想要的真实世界的理解、由工程师编程并生成模板来训练系统的场景。就比如用户搜索Apple,工程师会编写许多模板,食物,文章,定义,其他知识实体等,当用户选择苹果公司的结果最多的时候,那这个模板将被采用,而其他的模板就会变成种子集合。

过去的互动

搜索引擎将通过将结果放在适用的布局中,并查看用户的操作来测试他们对意图的理解是否正确。在我们上面的上文中,如果查询“what’s the beijing weather”的可能意图是我正在寻找问题的答案,他们将测试该假设,确定符合用户的模板。

最后,这与回答问题有什么关系?

我们首先需要了解他们如何将数据整合在一起以了解查询是否是问题。当然,当它是who,what,where,when,why,当how查询时,这很容易。但我们需要考虑他们如何知道“天气”或“meme”之类的查询是对特定信息的查询。因为这是一个没有任何疑问词开头的查询。

一旦使用上面讨论的技术,这其中建立了相互联系,剩下的就是找到答案。

因此,用户输入了一个单词,并且搜索引擎已经跳过了许多环节,以确定它可能是对特定答案的请求。接下来下一步就是要确定答案是什么。

发表评论