搜索幽灵新观察

近期很多朋友会有一些疑问:

百度更新频率为什么加快?

为什么我的站点今天还有几百页明天又剩下几页?

我的采集站点为什么不收录?

收录页面过少?

排名不稳定?

... ...

当然,百度最近的活动很频繁,我们有目共睹,仿佛就在一夜之间,这些波动现象大多是出自一些新站(不到半年的站点),没有什么内容的站点,采集站点(主要表现在不收录,收录数不稳定),今天枫林就这几点简单的做以阐述,不知道是巧合还鹦鹉学舌的缘故,记得去年的十月份,我们谈及到的最热门的话题也是Google的搜索幽灵现象,我们回放下镜头,因为07年国内SEO行业出现了不少新人,SEO的队伍慢慢在壮大,我们看到都深感欣慰,业内对SEO的看法也在慢慢转变,别的不说,中小企业,包括一些门户对SEO的重视就是最好的证明,这点枫林深有体会,当然也是亲身经历来的,先前的纽曼,阿里巴巴,zol等等都都曾有过招聘。枫林这里摘录一些关于去年Google幽灵的资料,可以和近期百度出现种种现象作一对比进行分析:

 Google有两种网络爬虫,主爬虫和新爬虫。主爬虫主要负责发现新的网页。一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

 新索引的建立还需要考虑其他非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排 名,猜测访客难以利用的新内容是什么。

尽管Google在作猜测,下列内容都是真实可信的:

1) 幽灵登陆页上的排名不能等同于索引页的排名。
2) 在每月新数据库建立之前,必须将幽灵登陆页从数据库中移走。但是,这只是暂时的移走。

如果您的索引中有这样登陆页,您的主要目标应该是让该页在Google新页上拥有排名。若您想做到这点,您需要定期、有规律、最好是每天,有一定间隔地更新网站内容。

为什么您想要在Google的新页上获取排名?因为在新页上有排名的网站更容易被抓取,索引更容易更新。但是在新页上的排名不是真正的排名,新页排名有很强的不稳定性。新页排名转化为真正排名需要经过一段时间。

... ...

当 Google搜索蜘蛛抓取一个新网页后,这个新网页会有什么反映?

一个新网页没有被Google主目录收取,直到:
1. 该网页被Google主目录搜索蜘蛛抓取。
2. 该网页在被Google主目录搜索蜘蛛抓取之后,须经过一段更新时间。

只有以上两条全都满足,新网页被Google主目录确确实实抓取到,新网页上的排名才有可能转化成真正排名 。

Google有两种抓取形式
1. 主抓取
2. 新抓取

 一个新的网页首先被“新抓取”蜘蛛抓取。但也有特例的时候。在Google月更新刚刚完成那一段时间之后,一个网页通常被“主抓取”蜘蛛抓取。每月更新一般在每个月的20号到28号之间,能够持续几天。

为了区分两种蜘蛛的差异,我们可以先来看一下一组IP 地址。

1. “主抓取”蜘蛛= 216.239.46.*
2. “新抓取”蜘蛛= 64.68.82.*

为了进一步解释明白新网页发生的Google幽灵现象,我们假设该网页首先被“新抓取”蜘蛛抓取。在Google两个月更新之间,“新抓取”蜘蛛来抓取新网页。在主抓取期间,通过链接新网页能够被抓 取。新抓取期间,情况也是一样。

尽管这个网页没有经过此次更新,也没有收录在Google主目录里,但是抓取之后,搜索蜘蛛开始衡量该网页内容和质量,并把该网页收录在搜索结果里。这次衡量是十分不稳定的,易受外界影响,经常发生变化。

当每月定期更新来临时,这些网页会产生波动。每月定期更新就是Google波动。但是,您需要记住,“主抓取”蜘蛛没有阅读该网页,所以这个网页没有加入主索引中。所以,当每月更新结束后,这个新 网页仍被看作是新网页但是不久以后,“主抓取”蜘蛛将会阅读这个新网页,在下个月更新之后,该页面才能被收录进主索引。这需要经历一段时间。在此之前,Google不显示任何导入链接,这个网页的排名也因此多变、不稳定。

... ...

看完这段资料之后也许对你有所启发,从目前状况来看,不单单Google存在搜索幽灵现象了,百度也有幽灵出现喽,当然,踏踏实实做站,认认真真发展内容的站点是不用担心这点的,搜索引擎对于所有的站点都是公平的,为什么一些站点起步是相同的,经过半年的发展就有不同的搜索表现,不同的发展呢?Webmaster们是不是应该考虑考虑了?你们都做了些什么?

这里很遗憾的说声,枫林做个人站长也有5年历史了吧,起起落落,但是至今还不会使用采集工具,多么累多么难找的资料都是我和我们团队(曾经和朋友一起搞)一篇一篇填充进去的,当然后来会好些了,有会员填充的多些,新站刚刚起步,总该给搜索引擎留个好印象吧,所以每次听说某某站点不收录,某某站点被K的消息,我都很心痛,个人站长也不容易,尤其是专职个人站长,美工,服务器,程序,推广等都是一个人完成的,付出那么多,如果站点被封,或者收录低下,域名降权,这是件很悲哀的事情。

最近出了搜索幽灵,百度有一些新动作专门针对采集类站点,新站不收录,收录少,或者是收录波动较大等怪异现象大都针对采集站了,当然一些不法站点就更难收录了,搜索引擎这样做并没有错,搜索的宗旨是为用户提供最优质的搜索体验,大范围的采集,没有经过任何的筛选,难免有很多垃圾信息,重复信息,不亚于复制站点的做法,所以前面有朋友向枫林索要整站下载器,觉得很勉强,不过我会告诉朋友,你参考别人的站点时可以的,但是不要直接拿别人的内容上传上去就完事了,做站没有那么简单。

最近也出现很多站点群建的软件?号称几分钟复制几十个站点,真不知道这些软件有什么值得拿出来炫耀的,当然,有什么效果,很多SEOer也许都试过了,自己也清楚,最起码我在点石看到有好多人说用了某某软件群建了一些站点都没有收录,或者集体降权了。任何时候我们SEO都要明白,我们是在改善站点的内容,改善站点的结构,目的在于给搜索引擎提供更优质的内容,更易于抓取的站点,给用带来更好的搜索体验,我们不能跟搜索对着干,这样站点被K,你也就没有什么怨言了,可以坦白的说,我没有这么做过,我的站点也没有被K过,唯一一次也是有惊无险,其中一个博客封了一个月,又恢复了,现在还白白胖胖的,营养良好。

注:虽然该文在SEO博客已经发布10多天了,但是感恩节总得拿出点东西来回报大家,回报点石这一年多来为SEO行业所作的一切。

枫林亲眼看到点石一天天的成长起来,最初看到是在Robin的Q签名,便第一个进来顶贴,这里就是最好的证明,点石为SEO界注入了一股新的力量,使得SEO走上正轨,逐渐规范化,现在很多单位和企业对SEO的重视就是最好的说明,另外,众多SEOer在这个平台上大公无私的分享精神更是值得我们学习和尊重,相信它她会走的更长更好,感谢Dunsh! 感谢Dunsher!

作者: 枫林
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

枫林的其他文章:
收藏本页到:
365Key | Yahoo! | 百度搜藏 | QQ书签 | Google Bookmark | del.icio.us




20 条评论来自

  1. 石头 on 11月 22nd, 2007

    谢谢,枫林这么仔细的分析。
    谢谢所有的Dunsher.

  2. 网站策划-杨帆 on 11月 22nd, 2007

    一更新,给我六个试验站都带来了不少的流量.枫林确实研究很透.杨帆在这里也同样感谢Dunsh! 感谢Dunsher!

  3. 枫林 on 11月 22nd, 2007

    凑热闹,少不了枫林^_^.

  4. 无剑 on 11月 23rd, 2007

    呵呵,枫林研究得仔细。自动建站那种东西泛滥了,就没价值了。垃圾站很难持久,太累。

  5. 网站策划-杨帆 on 11月 23rd, 2007

    枫林你跟的好紧.我刚发完一刷新,你就排在我后面了,既然是凑热闹我杨帆也来一下...

  6. wind on 11月 23rd, 2007

    百度,真的让人琢磨不定

  7. 郭健 on 11月 23rd, 2007

    “Google有两种网络爬虫,主爬虫和新爬虫。主爬虫主要负责发现新的网页。一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

    新索引的建立还需要考虑其他非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排 名,猜测访客难以利用的新内容是什么。”

    枫林:这个不太明白,主爬虫和新爬虫各自的主要任务是什么?新的网页被爬虫由发现到收录到排名的顺序是怎么样的?

  8. 郭健 on 11月 23rd, 2007

    一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

    这个也不明白。能详细说一下不?
    ps:qq:469212186

  9. 佳伦网站运营博客 on 11月 23rd, 2007

    大家都来感恩了,呵呵

  10. zz on 11月 23rd, 2007

    枫林分析得很到位,百度今天的搜索排名又在变化,许多词在今天都掉下几位。

  11. 枫林 on 11月 23rd, 2007

    To:郭健,见QQ消息

  12. seoguy on 11月 23rd, 2007

    新概念,

    幽灵

    dunsher

    学习了

  13. seo on 11月 23rd, 2007

    不好理解 有没有辅助的文章呀 我是菜鸟派的

  14. 幼儿教育图书 on 11月 23rd, 2007

    同上 “一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。”不明白什么意思?

  15. 无限 on 11月 23rd, 2007

    感谢分享!!!!

  16. 山东seo on 11月 23rd, 2007

    学习了。

    新站,也有了信心。

  17. David Chen on 11月 24th, 2007

    我的blog昨天还有几百页收录,今天就只留下 3页了,昏~
    昨天就看过这个文章了,觉得没出现在自已身上,就不理了,
    想不到今天就中招了..
    我的blog 90%是原创文学来的,..有达人可以帮忙看一下吗?
    是不是关键字堆积过多?

    google收录没变化, baidu收录由昨天的300页,变成今天的3页,缩水好大啊.

  18. 99魔术网 on 01月 24th, 2008

    百度在跳舞

  19. 减肥网 on 02月 22nd, 2008

    百度最近几个月,变化很大很大。新站加了考核期,老站对于更新及外联的权重,都有很大的变化。

  20. 感受北京 on 04月 17th, 2008

    最近一直被这个问题苦恼着,刚刚出的新内容排名表现不错,可是没多久就降了许多,有过一段时间又有所恢复,似乎这个时候才是真正的排名