Google在处理内容原创性问题?

Google最近有很大的变化,有一个变化特别值得探讨,加大了googlebot的抓取能力,加快了对新页面的收录。个人觉得这个是可喜的变化,很有可能正在处理的是近期一直在海内外讨论最多的内容原创性问题。

内容原创性问题,这个在世界都看来都比较头疼,特别是在版权意识还不够深入的中国,造就了大量的采集站和复制站点,衍生的含有大型站点复制内容,确比原创排名更好,收录更为及时。

不考虑其他可能的如法律等因素,仅从技术上考虑,要解决这个问题也不是那么容易,毕竟在转载的同时无法保证全部的转载都留有backlink,而google的最近收录加快是不是代表从基本的收录就在解决这个问题:加快新站或者说保证所有张收录速度都是一样的,那么以收录时间来判断是哪儿的原创问题。

这样的做法就是说,谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。这样的话,就可以极力打击采集站点,当然,对于转载站点来说,效果也是一样。 当然,任何东西没有十全十美,算法只是一种补充而已,中间还是可能出现转载站或者采集站偶尔高过现在的站。但如果google发现全部文章他的数据库里都有原始的记录,说简单点,就是说存在相同的记录,那么就减缓这个站的收录。一个小小的变化就解决了比较大的问题。我觉得google算法的动机上还是考虑了大部分站长的利益。

在中国特色的环境下,这种算法的出现无疑是一种最稳妥的解决方案。Google进入本土化运营以后,在这方面的一直在努力,不知道下次的算法更新是怎么样的惊喜?

作者: 搜索引擎营销 - 小鹏
原载: 点石互动搜索引擎优化博客
特别声明:本文除获得授权站点外,谢绝一切转载。

小鹏的其他文章:
收藏本页到:
365Key | del.icio.us




65 条评论来自

  1. 布衣 on 12月 12th, 2007

    这样当然是最好的了,原创者可以放心了,特别是小站新站的。

    但是我有一个疑问,同一篇文章里面的某个关键词,采集站和原创站的排名怎么定呢?某个页面的关键词排名和整站的内容(包括网站内的一切排名因素)以及外链都有关系,那往往也会出现采集站会更高一些;

    是否现在的意思就是说排名更多的把权重给先收录的?

  2. gnaw0725 on 12月 12th, 2007

    仅仅依赖时间算法是不行的。因为越是有权重的网站,更新频率越快,google抓取越快,而一些网站由于google抓取频率低,所以就落在后面。不幸的是,很多原创网站都属于后面一种。

  3. 佳伦网站运营博客 on 12月 12th, 2007

    这个在国内很难解决。 除非是法律上

  4. 宝宝 on 12月 12th, 2007

    真是个喜人的消息

  5. kugoo on 12月 12th, 2007

    感觉都以相同的速度抓取,不太现实。Google蜘蛛得多少?又得浪费多少?

  6. 薰香王子 on 12月 12th, 2007

    很喜欢点石的文章,我对于SEO来说是一个菜鸟:请教大家两个问题:1、在GOOGLE网站管理工具的控制后台验证网站时出现以下提示:“我们试图访问验证文件,但由于 DNS 错误未能访问您的域。原因可能是服务器关闭,或者到域的 DNS 路由有问题。请确保您的域可正确解析,然后重试。”请问这是什么原因呢!我们刚刚换了空间!是域名的问题还是空间的问题呢!请指教!谢谢!
    2、网站改版后,原来的网站Url都没有了,这就造成了404错误,应该如何做好呢!请给予指教!谢谢!

    请各位高手给予指点,在下感激不尽!在这里留言也可,或者把答案发到我的E-mail:wuhanmhj@126.com 谢谢!

  7. Se不是这样o地 on 12月 12th, 2007

    那我是原创,我的站点没有抄袭站点收录的快,那我岂不受苦更多。。。

  8. Soz on 12月 12th, 2007

    这个做法在中国什么时候能实现?

  9. 荧光笔 on 12月 12th, 2007

    这个很难实现吧。

    新文章不是即时收录的。

    如果我发一个原创文章在我的博客上。晚上8点收录。
    别人看到我的文章转载到了大的站点。晚上6点收录了。还是没有解决问题呀。

  10. 小林 on 12月 12th, 2007

    这样就好多了
    最近bot的确活跃很多 既然比百度的还活跃

  11. 傻根 on 12月 12th, 2007

    有些小站更新本来就慢.即使有原创的也末必能马上收录
    反倒先被采集的它的大站先收录...

  12. pjcoder on 12月 12th, 2007

    这个感觉不大可能啦,主要是抓取顺序的问题,google的蜘蛛不至于多到可以同时抓所有的网页

  13. seo草根 on 12月 12th, 2007

    Google这样做确实是可喜可贺!至少这样可以弥补对那些原创站长的忽视!
    可能这样也存在弊端,什么问题不可能完美解决的,只能离完美更近一点!

  14. jim on 12月 12th, 2007

    靠收录时间来辨别.那是很危险的. GOOGLE无法做到同一时间内对所有的站点同步更新. 所以大站和权值高的站有可能受到更频繁的礼遇. 但这并不代表他们是原创. 如果GOOGLE采用这种方法.无疑是加速灭杀原创.因为规模大的网站有更多的人力物力资源被他们关注的内容将是第一批被灭杀的对象. 如果这真的成为显示那只能是大的活小的死. GG也搞个宏观调控促使网络行业加速资产充足并购的步伐? 呵呵

  15. davidchen on 12月 12th, 2007

    做网站也是一种态度,态度决定内容的取向

  16. 山东seo on 12月 12th, 2007

    google的一个进步。值得庆祝。

  17. Jiang on 12月 12th, 2007

    从时间上来区分效果是很差的。

  18. 午夜客 on 12月 12th, 2007

    现在采集网站基本上不被收录了!

  19. 佳伦网站运营博客 on 12月 12th, 2007

    跟付费链接有点相似,很难判定,除非是人工

  20. toby on 12月 13th, 2007

    谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。

    确实没有十全十美的事
    同样一个文章,在china.com发出的,GG要几个小时收录
    而在focus.cn的17分钟就收录了
    我偶然发现的。
    如果遇到这样的问题就。。。

    任何东西没有十全十美,算法只是一种补充而已

  21. 深圳SEO on 12月 13th, 2007

    能有保障吗? 还是有点怀疑.

  22. 潍坊速效海外推广中心 on 12月 13th, 2007

    如果google能做到的话,真是原创之福。让我们拭目以待

  23. 零度光火 on 12月 13th, 2007

    我来说说原创的威力,我有个三亚的英文网,里面的文章96%是原创,在短短的1个多月,PR一下达到3,可以说没有外部连接.
    就是在点石那里也提到的GOOGLE一下大面积刷新PR的那段时间刷新的.

  24. 长沙SEO on 12月 13th, 2007

    Google的蜘蛛最近确实频繁了,不过加快速度并不能完全提高辨别能力,因为毕竟不可能实时更新,期待更多的手段综合来判断原创性。

  25. seoguy on 12月 13th, 2007

    希望个google能一直这样,版权问题实在难解决,真希望能有个很好的解决方法

  26. 尚诺-空心 on 12月 13th, 2007

    这样说也不科学完全科学啊,一些大站首先转载了一些小站上的东西,但是大站的更新频率和抓取频率都比这些小站甚至新站强,如果但从时间来看的话,也不尽准确吧!

  27. 郑州seo on 12月 13th, 2007

    不知道回不回出现那种情况,就是google专门弄个原创收录,就是作者写好原创文章后提交给google,google可以等着提交在对比就行了,以后技术成熟了可以在文章发布的时候同时提交到google

  28. 苏州seo on 12月 13th, 2007

    google的做法无疑是积极的 欢迎啊
    google和百度冰火两重天啊 百度现在不收站 google就加快新站的收录 google 赞一个

  29. 神秘顾客 on 12月 13th, 2007

    这个好啊,让站长能自己提交比较恰当.有了原创的内容就提交,这样就可以分辨了.

    原文:
    郑州seo on 十二月 13th, 2007
    不知道回不回出现那种情况,就是google专门弄个原创收录,就是作者写好原创文章后提交给google,google可以等着提交在对比就行了,以后技术成熟了可以在文章发布的时候同时提交到google

  30. 正佳团队博客 on 12月 13th, 2007

    其实我觉得博主的的观点值得考究,收录快我想应该还是不能够解决原创性的问题,比如一个企业站点先发布了一则促销信息,然后过一天左右这个企业的促销信息又发布在又型一点的分类门户,这样,由于两个站点在搜索引擎更新速度也不一样,大家可以想象会发生什么情况。我就做过类似的试验。除非搜索引擎能在加快收录的基础上再能判断内容的发表时间。这样我想才能更好。呵呵,大家可以讨论,一点愚见。

  31. 太极木家私 on 12月 14th, 2007

    我觉得GOOGLE判断起来很难公正.例如某篇原创性文章发布在一个新网站上,该网站还未GOOGLE被收录.那么复制这篇文章的其它网站就被默认为原创了?

  32. 小瓜 on 12月 15th, 2007

    确实最近的google抓取快了

  33. 中文博客之家 on 12月 15th, 2007

    原创的排名比转载的靠后,实有些弱肉强食之感,曾经试过多次这样的事情。

  34. xingxing on 12月 16th, 2007

    几星期前收录就减少了

  35. shadu on 12月 16th, 2007

    所以应该加强原创内容的比例

  36. 大卫 on 12月 17th, 2007

    任何技术的改进对这种问题只是相对的,绝对的禁止只能依靠绝对的自觉。

  37. 手机资讯 on 12月 23rd, 2007

    真的期待能很好的解决版权问题,现在的状况实在令原创者伤心

  38. 路过 on 12月 24th, 2007

    GOOGLE想法很好,但太简单了。如果能按照时间收录,就不用要什么多种参数进行排名了。自己砸自己脚。

  39. SEO优化研究室 on 12月 25th, 2007

    确实很快,新的网站没什么宣传,一天就被收录了,更让人不可思议的是,发出的文章一般几个小时就被收录。呵呵

  40. 范范 on 12月 29th, 2007

    希望早日实现把

  41. xingxing on 12月 30th, 2007

    现在收录速度快多了

  42. 无剑 on 01月 1st, 2008

    目前来说,国内直接用采集的站长非常多,所以过量的重复确实对搜索引擎效率已经造成了一定影响。并且频繁的采集使得原创内容很容易就被别人的复制所彪窃,搜索引擎确实有责任保护原创内容。Google在这方面走得比较快,但据我观察,百度似乎也有类似的改进。

  43. 郭子 on 01月 7th, 2008

    如果新站还没有收录那原创的怎么办?

  44. 布衣 on 01月 7th, 2008

    刚zac也写了一篇关于原创文章的;
    觉得大部分人都对于版权问题有着很大的关注和无奈;
    不过这个原创性问题的解决我想更多的只能期待搜索引擎;
    如果个人的精力都放在侵权上面,除非是很重要的东西,
    否则可能么那么多精力

  45. 网站优化 on 01月 10th, 2008

    Google处理的很好!我的很多文章搜索文章标题都排在第一了,但是百度。。俺就不发表高论了.以前不写原创,现在才知道写原创有多辛苦,抄袭有多可耻,

  46. wequ on 01月 15th, 2008

    搜索引擎与法律方面都完善才能解决这些问题,要不单凭SE估计有点难

  47. 丽人网 on 01月 16th, 2008

    google的收录确实快多了!

  48. 兼职 on 01月 20th, 2008

    确实现在不怎么收录采集的内容了,但是我感觉GG和baidu识别不出来那种把别人原创的文章稍做改动,做下内链变为己有,使搜索引擎感觉自己是在原创的行为,这样对原创作者也很不公平,这个怎么处理呢??

  49. 网站优化 on 01月 20th, 2008

    现在google已经完全成功了,百度搜索下我们是站长,是站长网转发的,google搜索下我们是站长就是我的博客了,我是原创!我爱google

  50. 机柜 on 01月 22nd, 2008

    原创很重要 你的虚拟主机配我的机柜一很好

  51. 喝小酒的网摘 on 02月 13th, 2008

    一些网站由于google抓取频率低,所以就落在后面。不幸的是,很多原创网站都属于后面一种。

  52. paintings on 02月 21st, 2008

    这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗

  53. 减肥网 on 02月 22nd, 2008

    “这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗”

    就看你怎么修改,以及修改的水平了。

  54. 广东seo服务jc on 03月 2nd, 2008

    “这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗”

    就看你怎么修改,以及修改的水平了。

    分段~~增加,或者减少关键词.再不行,干脆自己在上面写一段话好了.~!

  55. pcbsheji on 03月 14th, 2008

    要靠自觉,法律也是人搞出来的。

  56. 语言中国 on 03月 29th, 2008

    法治社会,依法治国,依法网络社会

  57. 漫画 on 04月 2nd, 2008

    挺棒的!!

    不过麻烦了数据量比较大的网站了。

    像娱乐站的!

  58. 破碎机 on 04月 8th, 2008

    说的好

  59. 破碎机 on 04月 8th, 2008

    原创很重要 你的虚拟主机配我的机柜一很好

  60. 一亿度 on 04月 13th, 2008

    我感觉Google对搜索结果进行排序时,好像是把pr高或流量大的网站的页面排在前面,原创的反而看不到了!

  61. szmodem on 04月 24th, 2008

    这个在中国估计很难解决。

  62. 厉害啊 on 05月 16th, 2008

    收益匪浅

  63. 设计与美 on 05月 16th, 2008

    这个网站很有个性啊,很单调朴实,但内容很多,看起来访问量也不错啊,值得学习

  64. 支持 on 06月 19th, 2008

    google的确很有个性。

  65. 写的好 on 11月 27th, 2008

    我自从接触SEO以来就知道了点石,每日一贴。我现在给一个医药网站做优化,感觉很吃力!希望能和大家探讨下,最好有QQ群之类的。