客服热线:400-962-6669 帮助中心 百推宝
微信

扫码关注百推宝微信

PageRank算法原理最新讲解

百推宝 2016-03-16 09:30:28 浏览 分享:
0

  PageRank是什么?以及PageRank指标有哪些?更新频率是怎样的,在前文已有分享。接下来分析PageRank算法原理中的计算要素。

  pagerank算法的计算方法是基于一个与当前网站页面相关的所有网页集合(主要是指该网页指向和被指向的网页集合),也就是说将该网页置身与一个比较大的方阵之中,在这个方阵之后网页与网页之间是通过互相指向的有向图来确定关系同时进行网页PR值的传递,假如网也的PR值为1那么相对于整体来说该页上从其他特定网页上继承过来的权重应该是PR(t)/L(t)[其中PR(t)指的是特定网页的pr值,L(t)指的是该网页的出站链接数目]。

  但是我们知道这是理想状态下的计算方法,一个网页上影响pr值的还有很多噪点,比如网页中的广告链接、网站之间相互链接的连接点是不能再此时同时计算出去的,也就是说该算法还需呀一个规范化的因子来纠正结果的正确性(规范化因子我们命名为d,通常d值取值为0.85)所以实际上谷歌Pagerank算法用来计算网站权重的计算公式应该是一个抛去其他噪点因素的干净公式:

  PR(A)=(1-d)+d[PR(t)/C(t1)+...+PR(tn)/C(tn)]

  从公式中我们还可以看到一个很令人困惑的问题,那就是该公式中并没有将相互链接的网站或者是形成闭环的网页链接(类似站群思想,将网页之间形成闭环来积累PR值)

  拿出来单独解释,对于相互之间互相链接的网站我们通过分析可以知道,二者之间的pr值如果在没有出站链接的情况下只会互相传递,不会向外流失,久而久之

  pr值就会慢慢积累越来越高,这对搜索引擎来说是不够友好的,所以在实际的pagerank算法中在计算的过程中是将这种闭环链接单独进行计算,同时也引

  入了衰退因子(下文中的E(U)),防止pr值过多的积累,该算法的结构如下:

  

谷歌pagerank算法拓展

  所以对这部分的权重计算公式可以简单的列举如下:

  

pagerank闭环算法

  主要思想就是该部分网页的权重R'(u)等于相互链接的网页pr值R(v)与网站的出战链接数目N(v)进行迭代计算,同时引入衰退因子E(U)来现在权重的积累。

  以上是对谷歌搜索引擎Pagerank算法原理中计算要素的详细阐述,想要了解更多网站排名优化技巧,敬请关注后续的《pagerank 如何用java实现》等网站排名优化技巧文章。


相关文章