Google在处理内容原创性问题?
Google最近有很大的变化,有一个变化特别值得探讨,加大了googlebot的抓取能力,加快了对新页面的收录。个人觉得这个是可喜的变化,很有可能正在处理的是近期一直在海内外讨论最多的内容原创性问题。
内容原创性问题,这个在世界都看来都比较头疼,特别是在版权意识还不够深入的中国,造就了大量的采集站和复制站点,衍生的含有大型站点复制内容,确比原创排名更好,收录更为及时。
不考虑其他可能的如法律等因素,仅从技术上考虑,要解决这个问题也不是那么容易,毕竟在转载的同时无法保证全部的转载都留有backlink,而google的最近收录加快是不是代表从基本的收录就在解决这个问题:加快新站或者说保证所有张收录速度都是一样的,那么以收录时间来判断是哪儿的原创问题。
这样的做法就是说,谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。这样的话,就可以极力打击采集站点,当然,对于转载站点来说,效果也是一样。 当然,任何东西没有十全十美,算法只是一种补充而已,中间还是可能出现转载站或者采集站偶尔高过现在的站。但如果google发现全部文章他的数据库里都有原始的记录,说简单点,就是说存在相同的记录,那么就减缓这个站的收录。一个小小的变化就解决了比较大的问题。我觉得google算法的动机上还是考虑了大部分站长的利益。
在中国特色的环境下,这种算法的出现无疑是一种最稳妥的解决方案。Google进入本土化运营以后,在这方面的一直在努力,不知道下次的算法更新是怎么样的惊喜?
作者: 搜索引擎营销 - 小鹏
原载: 点石互动搜索引擎优化博客
特别声明:本文除获得授权站点外,谢绝一切转载。
- 点石第二届SEO大赛筹备情况公告 - 2008-01-07
- 点石公告 - 2007-12-20
- Google付费链接政策再次变更 - 2007-11-30
- 探索SEO与电子商务之间的关系 - 2007-11-24
- 如何将访问量转换成交易-PPT下载 - 2007-11-22












这样当然是最好的了,原创者可以放心了,特别是小站新站的。
但是我有一个疑问,同一篇文章里面的某个关键词,采集站和原创站的排名怎么定呢?某个页面的关键词排名和整站的内容(包括网站内的一切排名因素)以及外链都有关系,那往往也会出现采集站会更高一些;
是否现在的意思就是说排名更多的把权重给先收录的?
仅仅依赖时间算法是不行的。因为越是有权重的网站,更新频率越快,google抓取越快,而一些网站由于google抓取频率低,所以就落在后面。不幸的是,很多原创网站都属于后面一种。
这个在国内很难解决。 除非是法律上
真是个喜人的消息
感觉都以相同的速度抓取,不太现实。Google蜘蛛得多少?又得浪费多少?
很喜欢点石的文章,我对于SEO来说是一个菜鸟:请教大家两个问题:1、在GOOGLE网站管理工具的控制后台验证网站时出现以下提示:“我们试图访问验证文件,但由于 DNS 错误未能访问您的域。原因可能是服务器关闭,或者到域的 DNS 路由有问题。请确保您的域可正确解析,然后重试。”请问这是什么原因呢!我们刚刚换了空间!是域名的问题还是空间的问题呢!请指教!谢谢!
2、网站改版后,原来的网站Url都没有了,这就造成了404错误,应该如何做好呢!请给予指教!谢谢!
请各位高手给予指点,在下感激不尽!在这里留言也可,或者把答案发到我的E-mail:wuhanmhj@126.com 谢谢!
那我是原创,我的站点没有抄袭站点收录的快,那我岂不受苦更多。。。
这个做法在中国什么时候能实现?
这个很难实现吧。
新文章不是即时收录的。
如果我发一个原创文章在我的博客上。晚上8点收录。
别人看到我的文章转载到了大的站点。晚上6点收录了。还是没有解决问题呀。
这样就好多了
最近bot的确活跃很多 既然比百度的还活跃
有些小站更新本来就慢.即使有原创的也末必能马上收录
反倒先被采集的它的大站先收录...
这个感觉不大可能啦,主要是抓取顺序的问题,google的蜘蛛不至于多到可以同时抓所有的网页
Google这样做确实是可喜可贺!至少这样可以弥补对那些原创站长的忽视!
可能这样也存在弊端,什么问题不可能完美解决的,只能离完美更近一点!
靠收录时间来辨别.那是很危险的. GOOGLE无法做到同一时间内对所有的站点同步更新. 所以大站和权值高的站有可能受到更频繁的礼遇. 但这并不代表他们是原创. 如果GOOGLE采用这种方法.无疑是加速灭杀原创.因为规模大的网站有更多的人力物力资源被他们关注的内容将是第一批被灭杀的对象. 如果这真的成为显示那只能是大的活小的死. GG也搞个宏观调控促使网络行业加速资产充足并购的步伐? 呵呵
做网站也是一种态度,态度决定内容的取向
google的一个进步。值得庆祝。
从时间上来区分效果是很差的。
现在采集网站基本上不被收录了!
跟付费链接有点相似,很难判定,除非是人工
谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。
确实没有十全十美的事
同样一个文章,在china.com发出的,GG要几个小时收录
而在focus.cn的17分钟就收录了
我偶然发现的。
如果遇到这样的问题就。。。
任何东西没有十全十美,算法只是一种补充而已
能有保障吗? 还是有点怀疑.
如果google能做到的话,真是原创之福。让我们拭目以待
我来说说原创的威力,我有个三亚的英文网,里面的文章96%是原创,在短短的1个多月,PR一下达到3,可以说没有外部连接.
就是在点石那里也提到的GOOGLE一下大面积刷新PR的那段时间刷新的.
Google的蜘蛛最近确实频繁了,不过加快速度并不能完全提高辨别能力,因为毕竟不可能实时更新,期待更多的手段综合来判断原创性。
希望个google能一直这样,版权问题实在难解决,真希望能有个很好的解决方法
这样说也不科学完全科学啊,一些大站首先转载了一些小站上的东西,但是大站的更新频率和抓取频率都比这些小站甚至新站强,如果但从时间来看的话,也不尽准确吧!
不知道回不回出现那种情况,就是google专门弄个原创收录,就是作者写好原创文章后提交给google,google可以等着提交在对比就行了,以后技术成熟了可以在文章发布的时候同时提交到google
google的做法无疑是积极的 欢迎啊
google和百度冰火两重天啊 百度现在不收站 google就加快新站的收录 google 赞一个
这个好啊,让站长能自己提交比较恰当.有了原创的内容就提交,这样就可以分辨了.
原文:
郑州seo on 十二月 13th, 2007
不知道回不回出现那种情况,就是google专门弄个原创收录,就是作者写好原创文章后提交给google,google可以等着提交在对比就行了,以后技术成熟了可以在文章发布的时候同时提交到google
其实我觉得博主的的观点值得考究,收录快我想应该还是不能够解决原创性的问题,比如一个企业站点先发布了一则促销信息,然后过一天左右这个企业的促销信息又发布在又型一点的分类门户,这样,由于两个站点在搜索引擎更新速度也不一样,大家可以想象会发生什么情况。我就做过类似的试验。除非搜索引擎能在加快收录的基础上再能判断内容的发表时间。这样我想才能更好。呵呵,大家可以讨论,一点愚见。
正佳团队博客,我认为你理解错误了点。
作者要表达的意思是:原创者自己把站点信息提交到搜索引擎,谁先提交就认为谁的原创者。
前提是:都有google的网站管理工具,而且都会在更新后第一时间去提交。但这个要实现还是有点困难。毕竟不是所有的原创这都会去提交,再者,大量的内容要提交也相当的困难。
我觉得GOOGLE判断起来很难公正.例如某篇原创性文章发布在一个新网站上,该网站还未GOOGLE被收录.那么复制这篇文章的其它网站就被默认为原创了?
确实最近的google抓取快了
原创的排名比转载的靠后,实有些弱肉强食之感,曾经试过多次这样的事情。
几星期前收录就减少了
所以应该加强原创内容的比例
任何技术的改进对这种问题只是相对的,绝对的禁止只能依靠绝对的自觉。
真的期待能很好的解决版权问题,现在的状况实在令原创者伤心
GOOGLE想法很好,但太简单了。如果能按照时间收录,就不用要什么多种参数进行排名了。自己砸自己脚。
确实很快,新的网站没什么宣传,一天就被收录了,更让人不可思议的是,发出的文章一般几个小时就被收录。呵呵
希望早日实现把
现在收录速度快多了
目前来说,国内直接用采集的站长非常多,所以过量的重复确实对搜索引擎效率已经造成了一定影响。并且频繁的采集使得原创内容很容易就被别人的复制所彪窃,搜索引擎确实有责任保护原创内容。Google在这方面走得比较快,但据我观察,百度似乎也有类似的改进。
如果新站还没有收录那原创的怎么办?
刚zac也写了一篇关于原创文章的;
觉得大部分人都对于版权问题有着很大的关注和无奈;
不过这个原创性问题的解决我想更多的只能期待搜索引擎;
如果个人的精力都放在侵权上面,除非是很重要的东西,
否则可能么那么多精力
Google处理的很好!我的很多文章搜索文章标题都排在第一了,但是百度。。俺就不发表高论了.以前不写原创,现在才知道写原创有多辛苦,抄袭有多可耻,
搜索引擎与法律方面都完善才能解决这些问题,要不单凭SE估计有点难
google的收录确实快多了!
确实现在不怎么收录采集的内容了,但是我感觉GG和baidu识别不出来那种把别人原创的文章稍做改动,做下内链变为己有,使搜索引擎感觉自己是在原创的行为,这样对原创作者也很不公平,这个怎么处理呢??
现在google已经完全成功了,百度搜索下我们是站长,是站长网转发的,google搜索下我们是站长就是我的博客了,我是原创!我爱google
原创很重要 你的虚拟主机配我的机柜一很好
一些网站由于google抓取频率低,所以就落在后面。不幸的是,很多原创网站都属于后面一种。
这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗
“这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗”
就看你怎么修改,以及修改的水平了。
“这个观点我同意,但是Copy来的东西加适当修改后,google能辨别出来吗”
就看你怎么修改,以及修改的水平了。
分段~~增加,或者减少关键词.再不行,干脆自己在上面写一段话好了.~!
原创内容?抄袭内容?
我看这个,只能通过法律手段来解决。
要靠自觉,法律也是人搞出来的。
法治社会,依法治国,依法网络社会
挺棒的!!
不过麻烦了数据量比较大的网站了。
像娱乐站的!
说的好
原创很重要 你的虚拟主机配我的机柜一很好
我感觉Google对搜索结果进行排序时,好像是把pr高或流量大的网站的页面排在前面,原创的反而看不到了!
这种方法不能百分百的管用的啊,也有一些不公平的问题。
这个在中国估计很难解决。
Copy来的东西加适当修改