首页 > Google专题 > Google定义隐藏页面

Google定义隐藏页面

作者:Zac 时间:2008年6月12日

大家都知道隐藏页面(cloaking)是作弊手法的一种。隐藏页面通常是根据访问请求的IP地址判断是搜索引擎蜘蛛还是普通用户,然后对蜘蛛和普通用户返回不同的内容。

但是根据IP不同返回不同内容,有的时候又不是作弊。所以这两者之间的界限,经常比较模糊。Google站长博客前两天发了个帖子,对四种情况做了比较明确的定义。下面半翻译,半评论。

地理定位 Geolocation

根据用户的地理位置,返回不同的针对特定地理位置的内容。判断这个地理位置可以是访问的IP地址,也可以是存储在用户电脑中的cookie,也可以 是注册用户所提供的地址。比如一个足球网站,如果一个已经注册过的用户提供的用户信息中地址填的是北京,当这个用户访问网站时,就返回更适合北京用户的内 容,更多报道北京队的成绩等。

IP Delivery IP传送

不太清楚应该怎样准确翻译,姑且叫做IP传送吧。

IP delivery是上面所说地理定位的一种。因为IP地址都是分配给不同地区的ISP,根据发送访问请求的IP地址,就可以判断出用户的地理位置,然后返回相应的内容。

IP delivery只是一种返回更恰当内容的技术手段,不一定就是作弊。像上面例子所说,一个没有注册的访问者来到网站,服务器通过检测用户IP地址,发现浏览者是来自北京,完全可以返回与来自上海的浏览者不同的内容。不但不是作弊,而且是更用户友好。

隐藏网页 Cloaking

这就属于作弊了。指的是搜索引擎蜘蛛访问时返回一套经过优化的内容,而普通用户访问时又返回另一套内容。鉴别是否是搜索引擎蜘蛛的方法还是包括通过 IP地址判断,因为IP地址属于哪个ISP或大的网络公司是可以查出来的。这也就是隐藏网页与IP delivery常常混淆的原因。

首次点击免费 First Click Free

有一些新闻网站内容是要收费的,但是又希望被搜索引擎收录。Google提供了首次点击免费机制,也就是说用户通过Google搜索结果来到这样的 收费网站,第一次点击时,用户可以看到正常内容,也就是Google蜘蛛所抓取的内容。但是同一个用户的第二次点击,将看不到新闻内容,而会被要求登录或 付费。

比较IP delivery和隐藏页面就可以知道,IP delivery是正常的事,隐藏页面是作弊。搜索引擎所要求的并不是不允许使用IP delivery,而是不要把搜索引擎蜘蛛特殊处理。假设搜索引擎蜘蛛是来自纽约数据中心,网站返回的内容就应该是同样来自纽约的普通用户看到的内容,而 不应该返回一套无论来自哪里的普通内容都看不到的,只有搜索引擎蜘蛛才能看到的内容。

隐藏页面其实是相当危险的技术。比如说从大家不知道是属于Google的IP地址,发出与普通浏览器一样的访问请求,抓取页面,抓取的内容与来自同一地理位置的正常蜘蛛抓取的内容一比较,就知道是否存在cloaking。

(这篇文章是前几天写的。昨天看到Google网站管理员博客也翻译了原文,大家可以对比着看吧。)

作者: Zac@中新国外主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Zac的其他文章:

Google专题

  1. 2008年6月12日09:21 | #1

    ..这个问题真有点迷茫呢..再认真看看

  2. 2008年6月12日09:28 | #2

    不错,google又进步了,特别讨厌这样的网站,我还这样给中了一次毒。

  3. 2008年6月12日09:56 | #3

    o 感谢ZAC的翻译

  4. 2008年6月12日10:12 | #4

    具体操作的时候,只需考虑用户体验就可以了.

    具体的这些是否作弊,相信google可以做一些工作来做的更完善.

  5. 2008年6月12日12:05 | #5

    学习啦!

  6. 2008年6月12日12:19 | #6

    晕乎乎的,好像没看懂

  7. 2008年6月12日13:20 | #7

    这种作弊手法,对于SEO来说.真的那么重要吗?

  8. 2008年6月12日16:38 | #8

    意义不大

  9. 这个是作弊吗?
    2008年6月12日18:24 | #9

    detail.zol.com.cn/desktop_pc_index/subcate27_list_1.html
    在google搜索电脑第一个就是这个网址,可是点击后就跳转了。

  10. 2008年6月12日19:23 | #10

    这个需要了解下
    不过google内部的东西不一定公布出来的

  11. 2008年6月12日22:23 | #11

    gg又下重手了

  12. 2008年6月12日23:09 | #12

    呵呵,这个还真不好判断

  13. 2008年6月12日23:13 | #13

    有一个更牛逼的作弊方法根本不像楼主说的这么复杂。只需要判断。。。嘿嘿。还是不说的好

    这种根据IP来判断的隐藏页面。目前SE还搞不定。哈哈。效果相当的好

  14. 2008年6月13日17:20 | #14

    危险的东西大家不要试验.嘿嘿.看看就好

  15. 2008年6月13日20:57 | #15

    没看明白

  16. 2008年6月14日00:25 | #16

    这个分辨太难了,没有太明确的界限

  17. 2008年6月14日12:19 | #17

    不作弊很多年了

  18. 秋水共长天一色------大鹏
    2008年6月14日22:38 | #18

    MS这几日 百度人工干预了这个站哦 还有Z大哥 你就告诉大家你用了NO佛搂 标签好了 你看这么多人来这里做链接 呵呵

  19. 2008年6月16日10:43 | #19

    来这里取经了!

  20. 2008年6月16日21:01 | #20

    呵呵 ..
    我在似懂非懂中...

  21. 2008年6月27日09:32 | #21

    感觉很多东西界定的都很模糊
    好像没有一个 固定的标准
    全是在道德了自律上面了

  22. haobound
    2008年7月15日10:01 | #22

    界限不是很清楚,也许seo就是这样

  23. 2008年8月25日14:19 | #23

    可以通过USER-AGENT判断搜索引擎

  24. 2008年12月22日09:20 | #24

    呵呵,作弊是先甜后苦的享受

  25. 2009年1月20日15:05 | #25

    讲得很好,学习了:)

  1. 目前还没有任何 trackbacks 和 pingbacks.
本文的评论功能被关闭了.