首页 > Google专题 > 最权威的Google排名算法解密

最权威的Google排名算法解密

作者:Zac 时间:2008年5月27日

说它最权威是因为是Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子。下面捡主要内容翻译一下,想看完整原文的请参考Google官方博客Google 搜索质量简介

搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询,Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些,以及以哪样的顺序显示。

Google对排名算法一直都比较保密,主要原因有两条:竞争及防止被滥用。

Google排名算法的细节是Google皇冠上的珍珠,我们以它为傲,并且非常注意保护。但是完全保密有时候也不是理想状况,所以Udi Manber等人决定与站长多沟通,谈一谈有什么新鲜事,解释一些老的内容,给点建议,参与对话等。这篇帖子是第一篇,以后还会有其他内容。

这个部门的心脏是核心排名小组。排名是相当困难的,比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的,文件也没有任何规则,怎样理解信 息没有标准。所以我们需要理解任何人,因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询,再将查询投射到我们所理解的文件上。更不要 说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。

Google排名算法最出名的部分就是PageRank。PR 现在还在使用中,不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块(处理短语,同义词,方言,拼写错误等的能力),查询模块(不仅仅是语 言,还包括人们怎样使用语言),时间模块(有的查询返回一个30分钟前刚创作的网页最合适,有的时候返回已经存在很长时间的网页更合适),个性化模块(不 是每个人都需要相同的东西)。

另外一个组负责评估我们做的怎样。目标是改善用户体验,这不是主要目标,而是唯一的目标。有每分钟进行的自动评估,阶段性整体质量评估,更重要的还 有个别算法调整的评估。当某个工程师有个好主意,开发一个新算法后,我们对这个主意进行测试。一组统计学家会检查数据,确定这个新主意的价值。

2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的 方法,有时我们也致力于简化算法,简单就是好的。(Zac的注释:关于简化算法这句话,是紧接着PR算法调整之后说的,不确认他是讲简化了PR算法,还是 说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是,基本上给我们看的工具条PR是不准的,尤其很多该有PR值得内页显示PR为 零。也许这就是Udi Manber所说的算法简化造成的。)

在过去两年中,国际搜索是我们的主要焦点之一,包括所有的语言,而不仅限于主要语言。

另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单,当我们增加新功能时,尽量确保对用户来说是简单易用的。在过去一年中,主要的改变包括整合搜索,Google Notebooks,自定义搜索引擎以及iGoogle的改进。用户界面小组有一组易用性专家,在辅助研究用户及评估新功能。

还有一个小组专注于反垃圾和其他各种被滥用的技巧,这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术,并且以可扩展的方式克服这些垃圾。和其他组一样,这个组也是要处理国际多语种。反垃圾组与Google站长工具组紧密配合。

还有其他专门的项目组。整体来说我们的组织结构相当非正式,人员调动频繁,新项目也随时开始。

作者: Zac@中新国外主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Zac的其他文章:

Google专题

  1. 2008年5月27日08:40 | #1

    百度什么时候也能出个算法??? 这两天波动很厉害

  2. 2008年5月27日08:52 | #2

    总而言之 言而总之 还是保密

  3. 2008年5月27日08:52 | #3

    深有感触!感谢翻译

  4. 2008年5月27日08:56 | #4

    感觉收获很大啊.

  5. 星空雨夜
    2008年5月27日09:01 | #5

    我是看不懂。。。呵呵,写的太深奥了哦。

  6. 2008年5月27日09:03 | #6

    "PR 现在还在使用中,不过已经是一个更大的一系统中的一部分。"

    请大家注意这一句,pr的专利就要过期了,看样子google和pr创始人在专利谈判上没有取得实质性的成果,已经考虑用其它的评估手段,取代pr了。

  7. 2008年5月27日09:15 | #7

    看来GG一直在不停的创新...Google 搜索质量简介这个链接总是打不开...有些郁闷:(

  8. 2008年5月27日09:15 | #8

    算法还包括个性化模块,那如果拥有google账户的人越来越多,google搜集的个性化信息越来越丰富的时候,是不是会有很多网站很难通过SEO做到在所有人搜索时结果都排在前列?因为“不是每个人都需要相同的东西”...

  9. 2008年5月27日09:34 | #9

    看了这个文章,没觉得有什么可用的信息,不过还是感谢分享。

  10. 2008年5月27日09:45 | #10

    真的是标题党啊!

  11. 2008年5月27日10:21 | #11

    ...........恩。。继续关注。。难怪PR这次这么变态//

  12. 2008年5月27日10:24 | #12

    个人还是更喜欢做GG的

  13. 2008年5月27日10:28 | #13

    说得确实是比较含糊。

  14. 2008年5月27日10:32 | #14

    Google官方出来谈这个东西,是否意味着google有了新的更强大的算法了?

  15. 2008年5月27日11:11 | #15

    谢谢 :)

  16. 2008年5月27日11:12 | #16

    频繁的调整算法不是很好,不过GG要比百度好多了
    百度的人工干预过强

  17. 2008年5月27日11:16 | #17

    说的太抽象

  18. 2008年5月27日11:20 | #18

    算法变动这么快?我猜是用两个标准,不时变变,让站长不能给太多黑帽和优化累积

  19. 2008年5月27日11:48 | #19

    或许这篇确实应该是相对“最权威”的,收藏了。

  20. 2008年5月27日11:51 | #20

    哇,抢个沙发,前天听 Google中国研究院副院长讲:Google的 "云"的强大,Google上的技术魅力, igooogle 的开源引用,与操作简单,佩服

  21. 2008年5月27日12:50 | #21

    嗯 看来还要继续关注啊。

  22. 2008年5月27日12:58 | #22

    GG开源,不错~百度能多学学GG就好了

  23. 2008年5月27日13:22 | #23

    看完了,但这只是GG工程师们说的一点皮毛,或许这些连皮毛都不是。希望后续会有更详细的。

  24. 2008年5月27日13:29 | #24

    什么时候发表篇百度排名算法解密

  25. 2008年5月27日13:31 | #25

    不错的文章,能分享就严重支持!他们是不可能就搜索引擎具体N多的算法一条一条列出的,但既是列出了也未必能看懂~~~

  26. 2008年5月27日13:49 | #26

    也算不上什么解密咯

  27. 2008年5月27日13:57 | #27

    看完文章 感觉 PR 还是很重要

  28. 2008年5月27日14:05 | #28

    发现了一个:搜索结果有可能最新的,也有可能很老的网页排在前面

  29. 2008年5月27日14:11 | #29

    哈哈,我以为是排名秘籍呢

  30. 2008年5月27日14:50 | #30

    PR算法真是被简化了。
    按照PR传递的理论来说,一般内页的PR怎么着也不至于变成灰色。

  31. 2008年5月27日17:23 | #31

    没什么有价值的东西
    不过好在能看出一些东西,该改变了

  32. 2008年5月27日18:28 | #32

    非常有用

  33. 2008年5月27日19:04 | #33

    看出点东西,感觉纯粹的seo以后比较难混啊

  34. 2008年5月27日19:53 | #34

    内部资料,,好像对站长用处不大吧

  35. 2008年5月27日21:59 | #35

    个人感觉现在PR值不重要了。

  36. 2008年5月27日23:00 | #36

    半懂不懂的,估计最原始的优化推广应该不会过时吧

  37. 2008年5月27日23:23 | #37

    几个模块的解释感觉已经体现出来了

  38. 2008年5月28日01:30 | #38

    点石的文章一天不如一天,感觉写blog也像是在上班一样,一点激情都没有,第一个回复是我发的,难道说你标题党有错吗?删除什么,见不得人啊?

  39. 2008年5月28日04:28 | #39

    刚在seo每日一贴那边也看到同样的文章,支持

  40. 2008年5月28日09:33 | #40

    还是说的很保密!!!!!

  41. 2008年5月28日09:51 | #41

    这个本来就知道的。

  42. 2008年5月28日09:53 | #42

    不过的确挺权威的。。。

  43. 2008年5月28日10:09 | #43

    讲的太笼统啦

  44. 2008年5月28日10:35 | #44

    秘密!不会说的,只能靠工作人员慢慢的试验,好不容易试验成功了,却又有了新的算法,难呀?

  45. 2008年5月28日10:51 | #45

    450次以上的调整,差不多每个星期9次。
    真佩服

  46. 2008年5月28日11:41 | #46

    点石的就是权威的

  47. 2008年5月28日15:01 | #47

    说的抽象不明白....

  48. 2008年5月28日16:35 | #48

    嘻嘻!老实地为用户服务吧,加上点都知道的SEO知识,你的站也会火。

  49. 2008年5月28日18:30 | #49

    太极拳打得越来越有意思了!

  50. 2008年5月28日19:22 | #50

    哎 不发表意见

  51. ruixiang
    2008年5月28日19:54 | #51

    解密?解个鸟密!

  52. 2008年5月29日01:42 | #52

    个人还是更喜欢做GG的
    百度太不稳定``

  53. 2008年5月29日06:12 | #53

    感谢分享,呵呵。

  54. 2008年5月29日09:31 | #54

    google从搜索方面确实比百度做得好

  55. 2008年5月29日09:36 | #55

    好像讲得比较笼统,实际上可操作的东西比较少.

  56. 2008年5月29日10:50 | #56

    看不太懂

  57. 2008年5月29日10:54 | #57

    对英文资料的理解力基本为0,但对google的内部资料非常好奇.
    pr每一次更新都会对很多站长产生影响,而目前还未找到尽快提升pr值的办法。
    单从人工干预因素考虑的话,感觉google比百度强多了。百度的部分关键词搜索结果页全是他们自己的产品在前几名,太让人无奈了

  58. kevin
    2008年5月29日11:18 | #58

    有点像标题党,看了没跟没看一样,还是没解密.

  59. 2008年5月29日14:56 | #59

    多元,我想这练个字可以说明些什么吧

    顺便想说下,一楼这位兄弟,百度也是有算法的,任何一个搜索引擎都有他们自己的算法的。

    呵呵,下次说这样的话不能坐一楼了喔,o(∩_∩)o...哈哈

  60. 2008年5月29日17:39 | #60

    ZAC总是走在前面,谢谢分享!

  61. 2008年6月1日08:14 | #61

    不错,以后不能盲目优化了。

  62. 2008年6月2日18:31 | #62

    确实还比较权威

  63. KC
    2008年6月5日16:44 | #63

    非常权威地讲解google技术小组职能的文章。
    批语:我只需知道自己的职能就足够了

    很傻,很天真地描述PR的重要性。
    批语:这个玩具还能玩多久?

    很好,很强大的一篇翻译文章。
    批语:“权威”和“算法”两词好像不太符合这篇文章的主题

  64. 2008年6月6日20:52 | #64

    标题有点误导性。呵呵

  65. 2008年6月7日00:47 | #65

    以后不能盲目优化了

  66. 2008年6月7日14:25 | #66

    gg还是比较好,时时漏点出来!谢谢分享

  67. 2008年6月29日22:36 | #67

    GG做好了,所有的都不会错!

  68. 2008年9月20日23:50 | #68

    读了点石不久. 但是收获蛮大.
    一直以来都很少关心谷歌的,一直都报着一颗平常心对待谷歌.
    直到最近才发现,谷歌来的流量越发的少了.
    是时候认真分析一下了.

  69. 2008年11月22日21:40 | #69

    不错~好久没来了 终于改版了~ 这样看起来舒服多了~

  70. 2008年12月25日14:50 | #70

    以前我的站只在GOOGLE里排名还可以,不过这次百度更新,我的站排名上去了,呵呵。

  71. 2009年1月4日21:45 | #71

    好像讲得比较笼统,实际上可操作的东西比较少.

  1. 目前还没有任何 trackbacks 和 pingbacks.
本文的评论功能被关闭了.