原创内容的尴尬
大家都知道,高质量的原创内容,是搜索引擎排名的一个重要依据,而且重要程度还在逐步提升。但是,现实的情况是,原创文章在搜索引擎索引中并不一定是原载,原载的并不一定是自己的原创。
这是搜索引擎的尴尬,一面极力倡导原创,并提高给予原创内容的权重,一面却无法很正确的识别出文章的“源”。这更是作者的尴尬,辛辛苦苦写好的文章,在搜索引擎中搜索,自己的原出处没有好的排名,转载自己文章的网站却排在前面。
搜索引擎能否完全正确识别文章的原创性,我认为目前还是个问题。
网站权重?如果按综合权重,门户级的网站就可以任意转载,并以此来获得更高的权重。
网站年龄?很多较大的网站,他们的运营时间远比新的小站、博客长,而事实上原创内容大多来源于小站和博客。
文章收录时间?权重较高的站收录更新快,文章很快就能收录,如果大站很快从原出处转载文章,先于原出处收录,那么文章算是谁的原创呢?
PR值?权威度?还是其他神秘因素?
这将导致一个问题:文章被转载,创作者没有得到给予原创内容应有权重,就无法提升网站综合权重;网站权重不能提升,新的文章再次被转载,再次不能获得权重……恶性循环。
通过对一些经常发表原创文章的网站、博客观察,Google在判定原创上做的比较好,大多数都能正确识别;而很多搜索引擎对于原创性大部分不能识别。
即使对原创识别能力较强的Google,也只是大多数情况下能够正确识别,还有很大一部分作者,辛辛苦苦写出来的文章,成为了别人的成果。有些网站在转载时还能写上作者、原出处,而一部分网站转载时连作者都省去了,更有甚者拿别人的文章,做上自己的链接,冠上自己的名号发布……
最近观察点石博客在搜索引擎中的表现,发现很多网站转载点石的文章,而没有按版权要求,以链接的形式署名。转载者请先查看点石互动版权声明,按既定的要求署名,这是对作者劳动成果的尊重,也是对点石互动的尊重。
一边号召原创,给予原创内容高的权重值,却一边打击原创作者,这样是不合适的。
搜索引擎应在提高原创内容权重值之前,完善相应算法,权重分配随着算法的完善程度提高,而不至于原创作者得不到应得的权重,进入一个恶性循环。
作者: 樂思蜀
原载: 点石互动搜索引擎优化博客
版权声明:转载请以链接的形式注明作者及原出处,并保留本版权信息,严禁一切非法复制。
欢迎访问点石论坛:http://www.dunsh.org/forums/thread-16119-1-1.html 参与本文的讨论。
樂思蜀的其他文章:- SearchWiki 到来,你准备好了吗? - 2008-11-21
- 致SEO初学者:学习SEO要注意的几个问题 - 2008-10-24
- Google PR 更新 - 2008-09-27
- AdSense实用手册下载 - 2008-09-09
- 淘宝禁止百度蜘蛛,为电子商务之争备战! - 2008-09-08
百度在这方面做得很好,尤其是知道、贴吧、百科等产品。
标准的负面典型。
这些因素都有考虑吧,综合考虑,还有就是发布时间,发布时间越早,越可能是源。当然,爬虫终究还是人研究出来的机器,不是万能的,即使是人,也无法百分百分辩哪里才是源出处。
这是一个很头疼的问题
确实尴尬
要对作者劳动成果的尊重
要改变,等于改变第三个世界-互联网世界
小站不容易啊
如果se可以认定帖子的发出时间而不是收录时间就好了!
写文章贵在知识交流!
嘿嘿,俺的东西被人转载时,连51la统计条、googlead之类的东西都给贴过去, 但是作者、出处之类的,却非得给删除了!好像留下这些东西就能显得自己不专业!
“Google在判定原创上做的比较好,大多数都能正确识别;而很多搜索引擎对于原创性大部分不能识别。”
很有同感,前几天我也写过类似的一篇博客,google在这方面可以说做的已经不错了,而百度根本就不行,甚至是写出原创地址的他也找不到,没办法,扶不起的阿斗。
只能期待技术上的突破。
在中国谈版权,开玩笑.
这确实是个严重的问题,而且我也很赞同作者说的,很多原创文章真的是出自小站长之手,但被高PR,时间长的老站转载去却成了他的源创.这原创识别技术上面各个SE都需要加紧
互联网如果不允许转载,那会是什么景象呢?
那个时候,才是思想迸发,百家争鸣啊!!
但愿那天早日来到。
有时候的确是这样 根本就分不清谁是原创谁是转载的!:(