搜索引擎算法工作的原理

Ranking——在SEO领域中谈论最多的话题之一,许多人都会想了解,什么是排名因素?做了什么就可以快速地获得排名?但是很少人想了解,为什么会存在搜索算法?它是会解决什么问题?它背后的原理/逻辑是什么?它究竟如何工作呢?

什么是算法?

算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。——百度百科

假设我现在在广州塔,我的目的地是上海东方明珠,那么我有几种方式选择呢?

方式1:直接乘坐飞机,✈广州→上海,大概3个半小时;

方式2:乘坐列车,🚝广州→上海,大概8个小时;

方式3:开汽车,🚗广州→上海,大概16个半小时;

那我输入一个指令,我要一个最经济的方式,那应该是方式2,或者我需要一个省时的方式,那肯定是方式1。大家到这里有没有可以想到,我输入的不同指令,就会得出不同的结果,这个指令就是一个公式,是可以得出我要的答案的公式。那么“算法”其实也就是这么一个原理,它在一定程度上是一条公式。

那接下来就可以来说,搜索引擎算法的公式。互联网的页面是以“亿”来计算的,索引库的资源成千亿上百万,用户是不可能一个个去浏览的。所以搜索引擎会制定许多的”算法“,为索引库的页面进行过滤筛选。

算法更新

搜索引擎谷歌每年都会发布多则数千次小算法更新,少则至少一个季度一次大算法更新。每次更新都会引起SEO社区的动荡。

先来了解一下,最基本的算法有哪些。

企鹅算法:主要解决的是为获得排名制造大量垃圾外链、低质量外链的网站。

熊猫算法:主要打击内容低质量的页面,如转载、抄袭的内容,大量用户发的垃圾留言、主体内容太少、关键词堆积等等。

RankBrain:以人工智能为基础的深入理解用户查询词的系统,尤其是长尾的、不常出现的查询。

BERT:让计算机能更好、更像人类一样地理解语言。更深入地从完整上下文理解词义,也能更准确理解搜索查询词背后的真正意图。

更多的算法更新可以参考Zac老师的【Google算法更新大全】

算法是如何工作的?

是由有很多因素在起作用。例如:URL,内容,内部链接,外部链接,图片,速度等进行评估,每一个算法就主要针对其中的一部分内容进行调整。

主要5 个领域(由 Google 正式列出),这些领域会影响特定查询将返回的结果:

1. 查询的含义

要返回相关结果,Google 必须了解用户究竟在搜索什么以及用户的搜索意图是什么。

Google必须理解和评估各种事情:

  • 单词的含义——所使用的单词在自然语言中究竟意味着什么?
  • 查询背后的搜索意图——用户使用特定查询想要什么——定义、评论、购买、查找特定网站?
  • 对内容新鲜度的需求——查询是否对时间敏感且需要新鲜信息?

有时它很简单。如果有人使用搜索查询“购买新 iPhone ”,那么在所有方面都非常清楚——含义、意图和对新鲜度的需求。

但有时,特别是对于一般查询,很难理解用户的确切意思。在这些情况下,Google 会显示它认为最好的结果,但会提供有助于指定搜索结果的其他选项。

2. 页面的相关性

其次,搜索引擎必须找到与搜索查询相关的页面。换句话说 –找到以最佳方式回答用户搜索查询的页面。

它通过定期抓取和索引互联网上的所有网站并分析其内容来实现。

关键字起到了关键作用。如果搜索查询和与搜索查询相关的短语出现在页面上,则该页面很可能与用户相关。

3. 内容质量

每个搜索查询可能有数百万个页面,因此 Google 必须优先考虑提供优质内容并证明的页面:

  • 专业知识
  • 权威
  • 可信度

此外,Google 使用多种垃圾邮件算法来检测试图使用垃圾邮件黑帽 SEO 技术进行排名的低质量页面。

4. 页面的可用性

既然谷歌涵盖了内容的相关性和质量,他们必须确保网站具有良好的可用性和用户友好性。

这包括技术方面,例如:

  • 页面响应能力
  • 在所有浏览器中的正确外观
  • 页面速度
  • 网站安全

这些可能不是最重要的因素,但当其他因素(如相关性和质量)相同时,它们肯定会被考虑在内。

5. 上下文和设置

最后但并非最不重要的一点是,搜索结果在很大程度上受到用户的个人情况和偏好的影响。

这些可能包括:

  • 用户所在地
  • 搜索历史
  • 搜索设置

Google举的例子是,当美国跟英国的用户搜索“football”,出现的结果是不同的。

如果您受到 Google 算法更新的影响,该怎么办?

  • 留意行业动态——可以关注谷歌搜索官方Twitter,也可以查看serountable, searchengineland, semrush等最新文章。
  • 要有耐心 ——大多数核心更新都会推出几天,所以最好等到尘埃落定。急于“快速修复”可能弊大于利。
  • 依赖可信赖的来源——不要相信每个论坛“专家”都能找到“100% 验证”的建议(有很多)。相反,等待可信赖的专家和出版物(如 Search Engine Journal 或 Moz)的分析。
  • 确保您需要修复——有时,在遇到算法更新后最好的办法就是什么都不做。许多更新会在几周后略微改进或恢复,因此请确保不要修复不需要修复的内容。
  • 改进——最后但并非最不重要的一点是,如果您意识到您的网站上存在可能导致您排名下降的问题,那么是时候修复它了。或者,也许重新考虑您的整个SEO 策略,更多地关注质量而不是数量。

建议阅读:

 

发表评论