解读百度的收录和清除站点规则
导读:在网上见到一网友发的一个帖子,要求百度制定搜索收录规则,而实际上百度早就已经制定了名为百度与站长的建站指南,公布了如何让网站被百度收录,什么样的网站会被百度拒绝收录或抛弃等相关条款。在我的《百度反作弊手段失去公信力》一文中,我提到:这些条款太过笼统,而在实际中可以被其意解释和曲解,并无实际的操作意义。那么,本文,石头就针对百度对应的拒绝收录和惩罚站点的相关条款进行分析.以让更多的人了解百度的相关规则。
--------------------------------------
百度相关规则的全文见于《百度与站长》,仔细阅读完毕,可以得出,一个站点被百度拒绝收录或惩罚的可能原因有如下几条(注意:每一条后面加上了对应的分析):
1。在标题中堆积与正文无关的关键词。
强调了标题和网站内容的相互呼应,如果标题中涉及到某一关键词,而实际网站内容中与该关键词无关的话,那么可能会百度删除.这一条款反映了百度的严格.但值得思考的是,百度是用什么方法去判断网站的内容与标题关键词的相关性呢?是不是标题出现了某关键词,正文就一定要出现呢???如果不是,那么百度目前的搜索技术难道能象人一样,会从意义和逻辑上去分析?比如机器能不能判断区标题中的亚克力跟正文中提到的有机玻璃是同一个意思呢?当然,如果百度全部采用人工审核站点,那么这一条就非常好,非常有操作性!但是这样又出现一个问题,人工审核相关不相关,以谁的说法为准?
2。使用自动跳转的页面,可能会被百度丢弃。
这一条不需多评论,主要针对一些作弊行为采用的跳转.大多数搜索引擎都会有类似的条款.
3。在同一个页面上,不要有过多链接。在那些站点地图类型的页面上,请把重要的内容给出链接, 而不是所有细枝末节。链接太多,也可能会导致无法被百度收录.
究竟多少连接,才算过多??Google好呆还建议最好不要超过100个,百度呢?百度凭这一条就可以任意的惩罚大部分的大型站点,大部分的大型站点首页都有了那么好几十个甚至好几百个连接的.
4。如果您的站点做了很多针对百度的优化,但却给用户带来大量负面体验,那么,您的站点最终可能还是会受到百度的冷落。
什么叫过多针对百度的优化呢?能不能有详细一点的标准?虽然这句话的意思是非常好,似乎任何一个有良知的网民都应该叫好,但是关键问题在于具体操作标准是什么?过度优化和负面体念,任何人都有不同的看法。比如我就是觉得百度搜索结果第一页全是广告,影响了我的感受,是不是该删除?
5。对于已经被重复了千百遍的内容,百度可能会不予收录。
这一点,不做评论。只是提醒大家复制内容也要找一点有新意的。
6。与一些垃圾站点做友情链接,很可能会使您的网站受到负面影响。因此,当有人很热情的要求您为他的站点提供友情链接时,请审视以下两点:
a,对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
b,对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使您的网站受到负面影响。
百度这一点,就有点太过天真了,百度惩罚了一个站点,也可以根据这一点任意的解释。如果你的网站上有几个连接,中间有那么一个连接名称和对方地位不相称的话,就可以找理由抛弃你的站点。
7.如果您的网站内容有不符合中国法律的地方,则无法被百度收录
这一点,无需多言。
8.如果您的站点页面结构复杂,则可能无法被百度收录
结构复杂导致无法收录的可能原因,百度只提到了上面的1,2,3点。
9.百度并不允诺能收录所有站点。
我们尊重百度的自由。当然百度如果不需要尊重用户,他封杀任何一个站点,都可以用这一点解释,而且让人呀口无言。
10.如果您的站点中的网页,做了很多针对搜索引擎而非用户的处理,使得:用户从搜索结果中看到的内容与页面实际内容完全不同,或者站点质量与站点在搜索结果中的排名极不相称,从而导致用户产生受欺骗感觉,那么,您的网站就有可能被百度丢弃。
这两点,靠机器是审核不出来了,只用人来定了。什么叫不相称。什么叫被骗,就只有公说公有理,当然百度是老大,他的反作弊小组成员说了算!依据此理由,可以删除不知道大部分站点。看样子以后百度得要求网站提供相关的权威和行业地位证明书,这样才能获得对应的排名,否则一律删除!
11. 如果您的站点上的网页,大量都是复制自互联网上的高度重复性的内容,那么,您的站点也有可能被百度丢弃。
见第5点的分析。
通过上面的条款和具体分析,发现百度大部分的条款都是过于主观,宽泛的,大部分的条款在实际操作中,只能依靠人并且该人当时的判断和情绪来定。根本不可能保证公正公平!依据这样的条款,几乎可以任意的删除和封杀目前至少50%以上的网站。比如搜索新闻的时候,中国新闻网(www.chinanews.com.cn)排在第二位,主要百度喜欢,完全可以根据站点质量与站点在搜索结果中的排名极不相称为理由来删除,而中国新闻网又可以拿什么来证明他们的网站确实有资格排在第二位,仅次新浪新闻呢?
显然,以上的条款完全是从百度的意志出发,从制度上也确实为百度大规模的清除或肆意惩罚站点清除了障碍,这样的条款,谈何无公信力?所以才会出现百度虽然有条款,却有人觉得不满要起诉,虽有条款,还有人呼吁要百度制定相关条款的事件!看样子,百度如果要真的做到让人信服,还真的有必要仔细研究一下相关的条款该怎么写了。
作者: 石头
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。
- 内容原创者们面临的搜索挑战 - 2007-12-06
- 点石视频:奥运年与搜索营销 - 2007-12-01
- 关键词排名:来者犹可追 - 2007-11-30
- 点石摘要:Google拥有了一家SEO公司! - 2007-11-30
- 原创内容版权保护的无奈 - 2007-11-26












BAIDU对使用自动跳转的页面非常的敏感,本人有个站无意的一个跳转(用REFRESH)没几天就被封了,至于其他,我看没什么关系。
呵呵,我的一个站点,不知道是不是因为英文的原因,收录了几天之后便无缘无故被baidu删除了。
你的站点是英文的,百度就不收?不会吧?
很不错.总结得非常详细.
恩学到不少的东西
我的网站快半年了,只给百度收一条
百度基本上属于中国搜索引擎行业内的垄断,不知道中国什么时候也有反垄断的法规条款!
百度的垄断本身就严重违背了互联网的精神!
百度封杀任何一个站点是没商量的,想当初3721也是NB的,3721怎么没干过百度?
不要希望寄托在百度自己的调整上,只有百度被遗弃的时候他再封杀也无任何意义!
反对百度的唯一法则,选择百度以外的搜索引擎!
视百度使用者为弱幼人群
我的网站收录数目很久没有变动了。。。
我的网站前两天在百度的排名还很高,这几天不知是否是使用了google广告还有google的搜索,我的网站大部分内容被封杀
我的站还没有被收录的说......
呵呵,读过文章,并自我检查后发现,我的博客是无缘无故不知任何原因的被删除了-_-!看来只有这一条说得通“百度并不允诺能收录所有站点。”
百度为什么总是作为我的首页,删也删不掉,改也改不掉,太气人了,是怎么回事,我该怎样不让百度作为首页?
我的网站很快被收录了~
我的站原来被百度收录数万条,但是很快之后就被封杀了,现在仅存一条.......无语
我的站,原来好好的,但是有一天baidu打电话给我问我做不做竞价排名,我说不做,之后就被删了
如果我是老大,我就可以定规则..一切由我说了算.
[...] 下面我根据石头写的《解读百度的收录和清除站点规则》逐条分析网络频道不被百度收录原因(网络频道文章数3000篇左右,其中有约一千篇文章非本人添加): [...]
这年头干啥都不容易,优化一下弄不好就被K了
百度真的有点不太好伺候
怎么中国人搞的公司都象流氓一样,钱也挣够了,怎么就不想想口碑呢
原先从BAIDU来的流量是GOOGLE的2倍,现在GOOGLE是他的3倍。
我的网站百度还没有收录了,都快两个月了。。。
我的网站收录数目很久没有变动了。。。