搜索引擎在查找能够满足用户请求的网页时,主要考虑两方面的因素:
一方面是用户发出的查询与网页内容的内容相似性得分,即网页和查询的相关性,(网站快速收录软件),第5章已经就内容相似性计算做了介绍;
另一方面就是通过链接分析方法计算获得的得分,即网页的重要性。搜索引擎融合两者,共同拟合出相似性评分函数,来对搜索结果进行排序。
如何理解:内容为王,外链为皇?
SEO行业里面会广为流传一句话:内容为王,外链为皇,什么是“外链为皇”,(闲鱼流量暴增系统用的好不好),外链为什么被SEO人员认为非常重要?
链接对于搜索引擎的作用:
一是传递推荐度
二是传递信任度
链接对于SEO人员的价值:
做好外链建设可以提升站点权重(权威度、信任度)、进而提高优化关键词的排名,获取更多展现的机会。
外链有30%的权重比例:
到目前为止,SEO行业一些专业人士通过各种方法测试,认为外链还能占到30%左右的权重。
外链是最容易做出效果的方法
虽然除了外链之后,域名年龄,服务器稳定性,内容更新以及其它都会对一个网站的权重产生影响,但是SEO人员来说,只有外链是最容易把控的。
通过搜索引擎发展史了解外链的价值
如果需要进一步了解清楚外链为什么皇,就需要回到搜索引擎的发展历史。
第一代:查询关键词和网页内容的相关性
对于第一代文本检索式搜索引擎,其重点关注的是查询关键词和网页内容的相关性。这种搜索方式假定用户输入的查询关键词就是用户的真实需求,很明显这种假设很难成立。另外,这种搜索方式对于信息的可信度也未做任何识别。
第二代:相关性+链接关系
第二代搜索引擎引入链接分析技术,(网站推广适合哪些行业),链接关系代表了一种推荐含义,而获得越多推荐的网页其链接分析得分越高,这其实是一种对网页可信度的度量标准。同时,第二代搜索引擎也利用了文本检索模型,来计算查询和网页内容的相关性。所以第二代搜索引擎是综合考虑了信息的相关性和可信性的,但是同样没有对用户需求做关注。
第三代:相关性+链接关系+用户体验
第三代搜索引擎的重点则是用户的真实需求,其他方面则兼顾了第二代搜索引擎的优点,即第三代搜索引擎同时考虑了3个核心问题。
主题敏感PageRank算法
主题敏感PageRank(Topic Sensitive PageRank)是PageRank算法的改进版本,该算法已被Google使用在个性化搜索服务中。主题敏感PageRank算法引入了16种主题类型,对于某个网页来说,对应某个主题类型都有相应的PageRank分值,即每个网页会被赋予16个主题相关PageRank分值。
主题敏感PageRank算法的启示:
在交换或购买友情链接的时候,最好能找那些与自己网站主题相关的站点,相关网站的外链对我们所优化的关键词排名提升效果更明显。
百度绿萝算法打击外链交易:
触发绿萝算法网站不对外传递权重
网站出现作弊特征触发绿萝算法后不对外传递权重,其理论来源于异常发现模型。
什么是异常发现模型?
异常发现模型也是一个高度抽象化的算法框架模型,其基本假设认为:作弊网页必然存在有异于正常网页的特征,这种特征有可能是内容方面的,(网站维护升级需要多长时间),也有可能是链接关系方面的。而制定具体算法的流程往往是先找到一些作弊的网页集合,分析出其异常特征有哪些,(网站快速排名是怎么做的),然后利用这些异常特征来识别作弊网页。
反作弊算法使用的基本假设
尽管反作弊算法五花八门,但是不论采取哪种具体算法,其实都包含了一些基本假设,经常被反作弊算法使用的基本假设有:
a. 尽管作弊网页喜欢将链接指向高质量网页,但是很少有高质量网页将链接指向作弊网站。
b. 作弊网页之间倾向于互相指向。
很多算法的基本思路都是从这些基本假设出发来构造的。