Page Rank让链接来"投票"

7月份PageRank快要更新, 虽说PR值现在Google算法中占的比例越来越小,但是当PR值更新时,看到自己的网站PR又升了,对于站长来说,还是有那种满足感,自豪感的。

以下内容可能是比较旧点,就算是重新温故一下,风采依扬也会把自己的一些经验及看法写进里面。

PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名。PageRank™是以公司創辦人拉里·佩奇(Larry Page)命名。是一种由搜索引擎根据网页之间相互的超链接计算的网页排名。它经常和搜索引擎优化有关。 PageRank系统被Google用来体现网页的相关性和重要性。Google的创始人拉里·佩奇和谢尔盖·布林1998年在斯坦福大学发明了这项技术。

首先让我们看看Google官方网站是怎么介绍它们自己的技术的:

PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。

此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。

2005年初,Google 为网页链接推出一项新属性 nofollow,令网站管理员和SEOer可以做出一些 Google 不会計算為投票的链接;这些链接不算作"投票"。nofollow 的设置可以抵制评论垃圾。

风采依扬在网上收集了一些关于PageRanK的算法,整理了一下,PageRank大体可以分为二种:

一、简单算法:
例如一个由4个页面组成的小团体:A,B, C 和 D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C 及 D的和。

PR(A) = PR(B) + PR(C) + PR(D)

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的 PageRank 上。

风采依扬觉得,根据链处总数平分一个页面的PR值。

最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1 − q。

所以一个页面的 PageRank 是由其他页面的PageRank计算得到。Google 不断的重复计算每个页面的 PageRank。如果您给每个页面一个随机 PageRank 值(非0),那么经过不断的重复计算,这些页面的 PR 值会趋向于正常和稳定。这就是搜索引擎使用它的原因。

二、完整的算法:

这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。

所以,这个等式如下:

p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是所有页面的数量

PageRank值是一个特殊矩阵中的特征向量。这个特征向量为

R是等式的答案

如果pj不链向pi, 而且对每个j都成立时,等于 0

这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。

这就是 PageRank 需要多项算法结合的原因。之前石头也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。

Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。

Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。

相信看完以上内容后对PageRank了解更深入。

我们可以知道搜索引擎用来评估网页质量的一种方法,就是PageRank,它经常被用来当作对Google搜索引擎网页要素评分之一。

你可以找到任何网页的PageRank分数,通过使用你的浏览器去浏览网页,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏上,马上就会显示出一个从0到10之间的数字,这就是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显示出网页的PageRank,但是在现在的PageRank算法中就是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有可能是0精确到100,甚至是到1000的数值。

PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度计算,而是按照一种指数刻度。这是一种非常繁杂的数学术语(之前文章也有提到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此一个PageRank5的网页和PageRank8的网页之间的差距会比你可能认为的要大很多。

PageRank值在这几天要更新了,我们谈谈现在PR的算法吧!当一个网页链接到你的网页时,搜索引擎是怎样转移这个网页的权威性到你的网站的(也就是PageRank的转移)。因此你希望从有最高PageRank得分的网页上获得链接,去不断的寻找高PR的站点,是不是呢?

这种方式在以前还管用,但是现在实际情况比这复杂了很多,一个权威性的转移与网页上存在的链接数量有关—链接越少,每个链接所转移的权威性就越高,因些,通常PageRank5网页上唯一的链接要比PageRank7上一百个链接中的一个要有价值。当然这也是有前提的,就是站于站之间的链接内容相似度要高一些。
如:
A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)
那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的网页来说,最重要的是被链接到那些能为你的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对一个潜在链接来源质量判断,而不要在做你的链接来源列表时盲目跟从PageRank。

PR值在这几天更新,祝SEOer好运!

作者: 风采依扬  @ 搜脉
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

风采依扬的其他文章:
收藏本页到:
365Key | del.icio.us




42 条评论来自

  1. fcicq on 07月 24th, 2007

    有人说PR一级差8倍.呵呵

    对wikipedia的倾向应该是trustrank的因素

  2. 核桃 on 07月 24th, 2007

    又是一篇技术文章啊,强~!

  3. double2 on 07月 24th, 2007

    呵呵,我的网站新开张,正等第一次pr刷新能变多少呢

  4. 胡戈戈 on 07月 24th, 2007

    搞个链接在这里,看看PR值会不会上升
    哈哈

    http://hi.baidu.com/huge

  5. 北极冰仔 on 07月 24th, 2007

    估计快了

  6. seo草根原创博客 on 07月 24th, 2007

    这么好的文章收藏起来,仔细阅读!

  7. kczm on 07月 24th, 2007

    盼星星。。。。
    还不来

  8. add365 on 07月 24th, 2007

    感受颇深.谢谢

  9. x宝盒 on 07月 24th, 2007

    那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明C站得到A站的得分高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

    A、B二站的相似度很高,怎么会C站得分高呢?

  10. 氧气层 on 07月 25th, 2007

    我的个人博客是新申请两个月的域名。。。

    看看第一次的PR是。。。。。

    嘿嘿

  11. 网络学院 on 07月 25th, 2007

    沙发?

    顺便问下,PR什么时候更新挖?等急死了。

  12. 玖伍贰柒 on 07月 25th, 2007

    温故而知新!

  13. 甘露 on 07月 25th, 2007

    我觉得单纯的做链接提高自己的page rank意义不大,page rank必须与其他的因素相结合时(比如文中提到的与相似内容网站做的链接),才能在网页排名时显示出它的作用。

  14. overspend on 07月 25th, 2007

    我20号就开始盼了。。。

  15. gnaw0725 on 07月 25th, 2007

    嗯,看看我这1个多月的努力,能带来什么样的结果。毕竟是从30ip到接近700IP。月访问流量 2万。
    活动目录管理日志 http://gnaw0725.blogbus.com

  16. gnaw0725 on 07月 25th, 2007

    其实,要做到pr5 也不是很难,一些论坛有首页的,把论坛文章整理一下,作些关键字,最多6个月,就行了。

  17. 风采依扬 on 07月 25th, 2007

    to:x宝盒
    已改正过来,谢谢提醒!

  18. [...] 从上图可以看出,从2000年7月一直到2004年7月,PR值的更新周期并没有像现在这么长,一般为一个月,最短的15天,最长的也才54天。算到今天,跟上次PR值更新已有86天,而Google目录距上次更新已达582天,看来的确快了。 If you liked this post, buy me a beer. [...]

  19. 丰宁坝上草原 on 07月 25th, 2007

    等得花儿都谢了,还没更新呀!

  20. 老萨 on 07月 25th, 2007

    我等,我等,我等等等。

  21. kangwin on 07月 25th, 2007

    我的互联网博客,等待新的pr值!

  22. 过把隐就死 on 07月 25th, 2007

    PR具体是哪天?
    我十几号的时候就听朋友说快了
    一直等到现在 哎~

  23. Blank on 07月 26th, 2007

    也收藏下!

  24. jrek on 07月 26th, 2007

    呵呵!不要刻意……

  25. 善良土匪 on 07月 26th, 2007

    也祝风采依扬好运

  26. 济南庆典 on 07月 26th, 2007

    等待提高排名...

  27. summer on 07月 26th, 2007

    公式好复杂啊~~有没有简单点的~~

  28. gnbbs on 07月 26th, 2007

    已做了301跳转,旧域名PR值竟比新域名高,费解.

  29. 大鱼 on 07月 27th, 2007

    楼上的,点石有文章分析过这种情况

  30. cnxjy on 07月 27th, 2007

    在这里搞链接是不会有PR加分的.根据我的经验这个算法是不对的.

  31. wuxi-seo on 07月 28th, 2007

    PR值现在Google算法中占的比例越来越小,确实这样,要不我的新站就不会很快的收录,并排在前面了,呵呵

  32. yuhua on 07月 31st, 2007

    还没更新啊???

  33. QQ花花 on 07月 31st, 2007

    我等到花都落了~~~

  34. 职趣职位搜索 on 07月 31st, 2007

    这一次pr值更新 好像比以往来得更晚一些。 ps:欢迎友情链接 http://www.jobcu.com

  35. handing on 08月 8th, 2007

    我的这个小站做起来有3个月了,到现在还没什么动静。
    各位高手能不能帮小弟看看是什么原因?先谢谢了。
    域名是:http://www.handing-capacitor.com

  36. [...] Page Rank让链接来”投票”http://www.dunsh.org/2007/07/24/pagerank_link/ [...]

  37. 杭州发光字 on 09月 24th, 2007

    公式看的很晕。

  38. 那村 on 11月 21st, 2007

    那我也留一个吧.
    http://nacun.com 那村,网络您的家庭

  39. Bombee's Blog on 01月 22nd, 2008

    天啊 这公式太复杂了

  40. 一亿度 on 04月 14th, 2008

    pr一级不是相差八倍,是六倍。33分就可以到pr3,但是要到pr4得超过194.4分。

  41. 永无之境 on 05月 4th, 2008

    6倍啊 ,太难弄了撒

  42. 周易 on 10月 5th, 2008

    6倍啊 ,太难弄了撒