首页 > Google专题, SEO行业新闻 > Page Rank让链接来"投票"

Page Rank让链接来"投票"

作者:风采依扬 时间:2007年7月24日

7月份PageRank快要更新, 虽说PR值现在Google算法中占的比例越来越小,但是当PR值更新时,看到自己的网站PR又升了,对于站长来说,还是有那种满足感,自豪感的。

以下内容可能是比较旧点,就算是重新温故一下,风采依扬也会把自己的一些经验及看法写进里面。

PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名。PageRank™是以公司創辦人拉里·佩奇(Larry Page)命名。是一种由搜索引擎根据网页之间相互的超链接计算的网页排名。它经常和搜索引擎优化有关。 PageRank系统被Google用来体现网页的相关性和重要性。Google的创始人拉里·佩奇和谢尔盖·布林1998年在斯坦福大学发明了这项技术。

首先让我们看看Google官方网站是怎么介绍它们自己的技术的:

PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。

此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。

2005年初,Google 为网页链接推出一项新属性 nofollow,令网站管理员和SEOer可以做出一些 Google 不会計算為投票的链接;这些链接不算作"投票"。nofollow 的设置可以抵制评论垃圾。

风采依扬在网上收集了一些关于PageRanK的算法,整理了一下,PageRank大体可以分为二种:

一、简单算法:
例如一个由4个页面组成的小团体:A,B, C 和 D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C 及 D的和。

PR(A) = PR(B) + PR(C) + PR(D)

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的 PageRank 上。

风采依扬觉得,根据链处总数平分一个页面的PR值。

最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1 − q。

所以一个页面的 PageRank 是由其他页面的PageRank计算得到。Google 不断的重复计算每个页面的 PageRank。如果您给每个页面一个随机 PageRank 值(非0),那么经过不断的重复计算,这些页面的 PR 值会趋向于正常和稳定。这就是搜索引擎使用它的原因。

二、完整的算法:

这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。

所以,这个等式如下:

p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是所有页面的数量

PageRank值是一个特殊矩阵中的特征向量。这个特征向量为

R是等式的答案

如果pj不链向pi, 而且对每个j都成立时,等于 0

这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。

这就是 PageRank 需要多项算法结合的原因。之前石头也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。

Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。

Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。

相信看完以上内容后对PageRank了解更深入。

我们可以知道搜索引擎用来评估网页质量的一种方法,就是PageRank,它经常被用来当作对Google搜索引擎网页要素评分之一。

你可以找到任何网页的PageRank分数,通过使用你的浏览器去浏览网页,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏上,马上就会显示出一个从0到10之间的数字,这就是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显示出网页的PageRank,但是在现在的PageRank算法中就是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有可能是0精确到100,甚至是到1000的数值。

PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度计算,而是按照一种指数刻度。这是一种非常繁杂的数学术语(之前文章也有提到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此一个PageRank5的网页和PageRank8的网页之间的差距会比你可能认为的要大很多。

PageRank值在这几天要更新了,我们谈谈现在PR的算法吧!当一个网页链接到你的网页时,搜索引擎是怎样转移这个网页的权威性到你的网站的(也就是PageRank的转移)。因此你希望从有最高PageRank得分的网页上获得链接,去不断的寻找高PR的站点,是不是呢?

这种方式在以前还管用,但是现在实际情况比这复杂了很多,一个权威性的转移与网页上存在的链接数量有关—链接越少,每个链接所转移的权威性就越高,因些,通常PageRank5网页上唯一的链接要比PageRank7上一百个链接中的一个要有价值。当然这也是有前提的,就是站于站之间的链接内容相似度要高一些。
如:
A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)
那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的网页来说,最重要的是被链接到那些能为你的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对一个潜在链接来源质量判断,而不要在做你的链接来源列表时盲目跟从PageRank。

PR值在这几天更新,祝SEOer好运!

作者: 风采依扬  @ 搜脉
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

风采依扬的其他文章:

Google专题, SEO行业新闻

  1. 2007年7月24日18:27 | #1

    有人说PR一级差8倍.呵呵

    对wikipedia的倾向应该是trustrank的因素

  2. 核桃
    2007年7月24日20:12 | #2

    又是一篇技术文章啊,强~!

  3. 2007年7月24日20:14 | #3

    呵呵,我的网站新开张,正等第一次pr刷新能变多少呢

  4. 2007年7月24日20:18 | #4

    搞个链接在这里,看看PR值会不会上升
    哈哈

    http://hi.baidu.com/huge

  5. 2007年7月24日20:27 | #5

    估计快了

  6. 2007年7月24日20:52 | #6

    这么好的文章收藏起来,仔细阅读!

  7. 2007年7月24日20:53 | #7

    盼星星。。。。
    还不来

  8. 2007年7月24日21:14 | #8

    感受颇深.谢谢

  9. 2007年7月24日21:57 | #9

    那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明C站得到A站的得分高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

    A、B二站的相似度很高,怎么会C站得分高呢?

  10. 2007年7月25日01:10 | #10

    我的个人博客是新申请两个月的域名。。。

    看看第一次的PR是。。。。。

    嘿嘿

  11. 2007年7月25日03:12 | #11

    沙发?

    顺便问下,PR什么时候更新挖?等急死了。

  12. 2007年7月25日07:35 | #12

    温故而知新!

  13. 甘露
    2007年7月25日08:26 | #13

    我觉得单纯的做链接提高自己的page rank意义不大,page rank必须与其他的因素相结合时(比如文中提到的与相似内容网站做的链接),才能在网页排名时显示出它的作用。

  14. overspend
    2007年7月25日08:53 | #14

    我20号就开始盼了。。。

  15. 2007年7月25日09:05 | #15

    嗯,看看我这1个多月的努力,能带来什么样的结果。毕竟是从30ip到接近700IP。月访问流量 2万。
    活动目录管理日志 http://gnaw0725.blogbus.com

  16. 2007年7月25日09:14 | #16

    其实,要做到pr5 也不是很难,一些论坛有首页的,把论坛文章整理一下,作些关键字,最多6个月,就行了。

  17. 风采依扬
    2007年7月25日10:27 | #17

    to:x宝盒
    已改正过来,谢谢提醒!

  18. 2007年7月25日12:31 | #18

    等得花儿都谢了,还没更新呀!

  19. 老萨
    2007年7月25日17:14 | #19

    我等,我等,我等等等。

  20. 2007年7月25日18:05 | #20

    我的互联网博客,等待新的pr值!

  21. 2007年7月25日21:04 | #21

    PR具体是哪天?
    我十几号的时候就听朋友说快了
    一直等到现在 哎~

  22. 2007年7月26日01:21 | #22

    也收藏下!

  23. 2007年7月26日09:00 | #23

    呵呵!不要刻意……

  24. 2007年7月26日10:13 | #24

    也祝风采依扬好运

  25. 2007年7月26日13:15 | #25

    等待提高排名...

  26. summer
    2007年7月26日13:25 | #26

    公式好复杂啊~~有没有简单点的~~

  27. 2007年7月26日16:14 | #27

    已做了301跳转,旧域名PR值竟比新域名高,费解.

  28. 2007年7月27日08:30 | #28

    楼上的,点石有文章分析过这种情况

  29. 2007年7月27日09:49 | #29

    在这里搞链接是不会有PR加分的.根据我的经验这个算法是不对的.

  30. 2007年7月28日10:12 | #30

    PR值现在Google算法中占的比例越来越小,确实这样,要不我的新站就不会很快的收录,并排在前面了,呵呵

  31. 2007年7月31日05:26 | #31

    还没更新啊???

  32. 2007年7月31日05:28 | #32

    我等到花都落了~~~

  33. 2007年7月31日10:52 | #33

    这一次pr值更新 好像比以往来得更晚一些。 ps:欢迎友情链接 http://www.jobcu.com

  34. 2007年8月8日16:23 | #34

    我的这个小站做起来有3个月了,到现在还没什么动静。
    各位高手能不能帮小弟看看是什么原因?先谢谢了。
    域名是:http://www.handing-capacitor.com

  35. 2007年9月24日12:34 | #35

    公式看的很晕。

  36. 2007年11月21日16:42 | #36

    那我也留一个吧.
    http://nacun.com 那村,网络您的家庭

  37. 2008年1月22日22:20 | #37

    天啊 这公式太复杂了

  38. 2008年4月14日18:36 | #38

    pr一级不是相差八倍,是六倍。33分就可以到pr3,但是要到pr4得超过194.4分。

  39. 2008年5月4日23:28 | #39

    6倍啊 ,太难弄了撒

  40. 2008年10月5日11:05 | #40

    6倍啊 ,太难弄了撒

  1. 2007年7月25日12:21 | #1
  2. 2007年8月22日12:43 | #2
本文的评论功能被关闭了.