最权威的Google排名算法解密

说它最权威是因为是Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子。下面捡主要内容翻译一下,想看完整原文的请参考Google官方博客Google 搜索质量简介

搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询,Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些,以及以哪样的顺序显示。

Google对排名算法一直都比较保密,主要原因有两条:竞争及防止被滥用。

Google排名算法的细节是Google皇冠上的珍珠,我们以它为傲,并且非常注意保护。但是完全保密有时候也不是理想状况,所以Udi Manber等人决定与站长多沟通,谈一谈有什么新鲜事,解释一些老的内容,给点建议,参与对话等。这篇帖子是第一篇,以后还会有其他内容。

这个部门的心脏是核心排名小组。排名是相当困难的,比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的,文件也没有任何规则,怎样理解信 息没有标准。所以我们需要理解任何人,因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询,再将查询投射到我们所理解的文件上。更不要 说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。

Google排名算法最出名的部分就是PageRank。PR 现在还在使用中,不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块(处理短语,同义词,方言,拼写错误等的能力),查询模块(不仅仅是语 言,还包括人们怎样使用语言),时间模块(有的查询返回一个30分钟前刚创作的网页最合适,有的时候返回已经存在很长时间的网页更合适),个性化模块(不 是每个人都需要相同的东西)。

另外一个组负责评估我们做的怎样。目标是改善用户体验,这不是主要目标,而是唯一的目标。有每分钟进行的自动评估,阶段性整体质量评估,更重要的还 有个别算法调整的评估。当某个工程师有个好主意,开发一个新算法后,我们对这个主意进行测试。一组统计学家会检查数据,确定这个新主意的价值。

2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的 方法,有时我们也致力于简化算法,简单就是好的。(Zac的注释:关于简化算法这句话,是紧接着PR算法调整之后说的,不确认他是讲简化了PR算法,还是 说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是,基本上给我们看的工具条PR是不准的,尤其很多该有PR值得内页显示PR为 零。也许这就是Udi Manber所说的算法简化造成的。)

在过去两年中,国际搜索是我们的主要焦点之一,包括所有的语言,而不仅限于主要语言。

另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单,当我们增加新功能时,尽量确保对用户来说是简单易用的。在过去一年中,主要的改变包括整合搜索,Google Notebooks,自定义搜索引擎以及iGoogle的改进。用户界面小组有一组易用性专家,在辅助研究用户及评估新功能。

还有一个小组专注于反垃圾和其他各种被滥用的技巧,这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术,并且以可扩展的方式克服这些垃圾。和其他组一样,这个组也是要处理国际多语种。反垃圾组与Google站长工具组紧密配合。

还有其他专门的项目组。整体来说我们的组织结构相当非正式,人员调动频繁,新项目也随时开始。

作者: Zac@中新国外主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Zac的其他文章:
收藏本页到:
365Key | Yahoo! | 百度搜藏 | QQ书签 | Google Bookmark | del.icio.us




67 条评论来自

  1. 农家乐 on 05月 27th, 2008

    百度什么时候也能出个算法??? 这两天波动很厉害

  2. 痴情的猪 on 05月 27th, 2008

    总而言之 言而总之 还是保密

  3. 一片天 on 05月 27th, 2008

    深有感触!感谢翻译

  4. BT下载 on 05月 27th, 2008

    感觉收获很大啊.

  5. 星空雨夜 on 05月 27th, 2008

    我是看不懂。。。呵呵,写的太深奥了哦。

  6. gnaw0725 on 05月 27th, 2008

    "PR 现在还在使用中,不过已经是一个更大的一系统中的一部分。"

    请大家注意这一句,pr的专利就要过期了,看样子google和pr创始人在专利谈判上没有取得实质性的成果,已经考虑用其它的评估手段,取代pr了。

  7. 泥鳅 on 05月 27th, 2008

    看来GG一直在不停的创新...Google 搜索质量简介这个链接总是打不开...有些郁闷:(

  8. 平野星原 on 05月 27th, 2008

    算法还包括个性化模块,那如果拥有google账户的人越来越多,google搜集的个性化信息越来越丰富的时候,是不是会有很多网站很难通过SEO做到在所有人搜索时结果都排在前列?因为“不是每个人都需要相同的东西”...

  9. 企业SEO on 05月 27th, 2008

    看了这个文章,没觉得有什么可用的信息,不过还是感谢分享。

  10. 标题党 on 05月 27th, 2008

    真的是标题党啊!

  11. SKF on 05月 27th, 2008

    ...........恩。。继续关注。。难怪PR这次这么变态//

  12. qiuzi on 05月 27th, 2008

    个人还是更喜欢做GG的

  13. 港盛国际 on 05月 27th, 2008

    说得确实是比较含糊。

  14. sean on 05月 27th, 2008

    Google官方出来谈这个东西,是否意味着google有了新的更强大的算法了?

  15. kyw on 05月 27th, 2008

    谢谢 :)

  16. PR10的网站 on 05月 27th, 2008

    频繁的调整算法不是很好,不过GG要比百度好多了
    百度的人工干预过强

  17. 小弟弟 on 05月 27th, 2008

    说的太抽象

  18. baudu on 05月 27th, 2008

    算法变动这么快?我猜是用两个标准,不时变变,让站长不能给太多黑帽和优化累积

  19. Dickey on 05月 27th, 2008

    或许这篇确实应该是相对“最权威”的,收藏了。

  20. 小朱看世界 on 05月 27th, 2008

    哇,抢个沙发,前天听 Google中国研究院副院长讲:Google的 "云"的强大,Google上的技术魅力, igooogle 的开源引用,与操作简单,佩服

  21. 孔德修 on 05月 27th, 2008

    嗯 看来还要继续关注啊。

  22. Guwei on 05月 27th, 2008

    GG开源,不错~百度能多学学GG就好了

  23. hunanz! on 05月 27th, 2008

    看完了,但这只是GG工程师们说的一点皮毛,或许这些连皮毛都不是。希望后续会有更详细的。

  24. 稻草人 on 05月 27th, 2008

    什么时候发表篇百度排名算法解密

  25. 搜索引擎优化 on 05月 27th, 2008

    不错的文章,能分享就严重支持!他们是不可能就搜索引擎具体N多的算法一条一条列出的,但既是列出了也未必能看懂~~~

  26. SEO on 05月 27th, 2008

    也算不上什么解密咯

  27. danaiou on 05月 27th, 2008

    看完文章 感觉 PR 还是很重要

  28. SMT on 05月 27th, 2008

    发现了一个:搜索结果有可能最新的,也有可能很老的网页排在前面

  29. dofus kamas on 05月 27th, 2008

    哈哈,我以为是排名秘籍呢

  30. 飘易 on 05月 27th, 2008

    PR算法真是被简化了。
    按照PR传递的理论来说,一般内页的PR怎么着也不至于变成灰色。

  31. ut on 05月 27th, 2008

    没什么有价值的东西
    不过好在能看出一些东西,该改变了

  32. 民族 on 05月 27th, 2008

    非常有用

  33. 发表天论 on 05月 27th, 2008

    看出点东西,感觉纯粹的seo以后比较难混啊

  34. 佳伦网站运营博客 on 05月 27th, 2008

    内部资料,,好像对站长用处不大吧

  35. Div之家 on 05月 27th, 2008

    个人感觉现在PR值不重要了。

  36. cmpchn on 05月 27th, 2008

    半懂不懂的,估计最原始的优化推广应该不会过时吧

  37. 小舟 on 05月 27th, 2008

    几个模块的解释感觉已经体现出来了

  38. 标题党 on 05月 28th, 2008

    点石的文章一天不如一天,感觉写blog也像是在上班一样,一点激情都没有,第一个回复是我发的,难道说你标题党有错吗?删除什么,见不得人啊?

  39. DJ on 05月 28th, 2008

    刚在seo每日一贴那边也看到同样的文章,支持

  40. seo服务 on 05月 28th, 2008

    还是说的很保密!!!!!

  41. adobe cs4 on 05月 28th, 2008

    这个本来就知道的。

  42. adobe cs4 on 05月 28th, 2008

    不过的确挺权威的。。。

  43. 门窗 on 05月 28th, 2008

    讲的太笼统啦

  44. 输入法 on 05月 28th, 2008

    秘密!不会说的,只能靠工作人员慢慢的试验,好不容易试验成功了,却又有了新的算法,难呀?

  45. SEO学院 on 05月 28th, 2008

    450次以上的调整,差不多每个星期9次。
    真佩服

  46. BDSN on 05月 28th, 2008

    点石的就是权威的

  47. om on 05月 28th, 2008

    说的抽象不明白....

  48. 中文每日精粹 on 05月 28th, 2008

    嘻嘻!老实地为用户服务吧,加上点都知道的SEO知识,你的站也会火。

  49. 核桃 on 05月 28th, 2008

    太极拳打得越来越有意思了!

  50. 北京seo on 05月 28th, 2008

    哎 不发表意见

  51. ruixiang on 05月 28th, 2008

    解密?解个鸟密!

  52. 扬扬芳 on 05月 29th, 2008

    个人还是更喜欢做GG的
    百度太不稳定``

  53. dofus on 05月 29th, 2008

    感谢分享,呵呵。

  54. andyzqj on 05月 29th, 2008

    google从搜索方面确实比百度做得好

  55. 盘龙 on 05月 29th, 2008

    好像讲得比较笼统,实际上可操作的东西比较少.

  56. 买芯片网 on 05月 29th, 2008

    看不太懂

  57. NiLaDa on 05月 29th, 2008

    对英文资料的理解力基本为0,但对google的内部资料非常好奇.
    pr每一次更新都会对很多站长产生影响,而目前还未找到尽快提升pr值的办法。
    单从人工干预因素考虑的话,感觉google比百度强多了。百度的部分关键词搜索结果页全是他们自己的产品在前几名,太让人无奈了

  58. kevin on 05月 29th, 2008

    有点像标题党,看了没跟没看一样,还是没解密.

  59. 大话博客 on 05月 29th, 2008

    多元,我想这练个字可以说明些什么吧

    顺便想说下,一楼这位兄弟,百度也是有算法的,任何一个搜索引擎都有他们自己的算法的。

    呵呵,下次说这样的话不能坐一楼了喔,o(∩_∩)o...哈哈

  60. blank on 05月 29th, 2008

    ZAC总是走在前面,谢谢分享!

  61. zixiseo on 06月 1st, 2008

    不错,以后不能盲目优化了。

  62. 情感屋 on 06月 2nd, 2008

    确实还比较权威

  63. KC on 06月 5th, 2008

    非常权威地讲解google技术小组职能的文章。
    批语:我只需知道自己的职能就足够了

    很傻,很天真地描述PR的重要性。
    批语:这个玩具还能玩多久?

    很好,很强大的一篇翻译文章。
    批语:“权威”和“算法”两词好像不太符合这篇文章的主题

  64. 婚纱 on 06月 6th, 2008

    标题有点误导性。呵呵

  65. hello on 06月 7th, 2008

    以后不能盲目优化了

  66. 设计知识资源网 on 06月 7th, 2008

    gg还是比较好,时时漏点出来!谢谢分享

  67. 小沈阳 on 06月 29th, 2008

    GG做好了,所有的都不会错!