Google定义隐藏页面

大家都知道隐藏页面(cloaking)是作弊手法的一种。隐藏页面通常是根据访问请求的IP地址判断是搜索引擎蜘蛛还是普通用户,然后对蜘蛛和普通用户返回不同的内容。

但是根据IP不同返回不同内容,有的时候又不是作弊。所以这两者之间的界限,经常比较模糊。Google站长博客前两天发了个帖子,对四种情况做了比较明确的定义。下面半翻译,半评论。

地理定位 Geolocation

根据用户的地理位置,返回不同的针对特定地理位置的内容。判断这个地理位置可以是访问的IP地址,也可以是存储在用户电脑中的cookie,也可以 是注册用户所提供的地址。比如一个足球网站,如果一个已经注册过的用户提供的用户信息中地址填的是北京,当这个用户访问网站时,就返回更适合北京用户的内 容,更多报道北京队的成绩等。

IP Delivery IP传送

不太清楚应该怎样准确翻译,姑且叫做IP传送吧。

IP delivery是上面所说地理定位的一种。因为IP地址都是分配给不同地区的ISP,根据发送访问请求的IP地址,就可以判断出用户的地理位置,然后返回相应的内容。

IP delivery只是一种返回更恰当内容的技术手段,不一定就是作弊。像上面例子所说,一个没有注册的访问者来到网站,服务器通过检测用户IP地址,发现浏览者是来自北京,完全可以返回与来自上海的浏览者不同的内容。不但不是作弊,而且是更用户友好。

隐藏网页 Cloaking

这就属于作弊了。指的是搜索引擎蜘蛛访问时返回一套经过优化的内容,而普通用户访问时又返回另一套内容。鉴别是否是搜索引擎蜘蛛的方法还是包括通过 IP地址判断,因为IP地址属于哪个ISP或大的网络公司是可以查出来的。这也就是隐藏网页与IP delivery常常混淆的原因。

首次点击免费 First Click Free

有一些新闻网站内容是要收费的,但是又希望被搜索引擎收录。Google提供了首次点击免费机制,也就是说用户通过Google搜索结果来到这样的 收费网站,第一次点击时,用户可以看到正常内容,也就是Google蜘蛛所抓取的内容。但是同一个用户的第二次点击,将看不到新闻内容,而会被要求登录或 付费。

比较IP delivery和隐藏页面就可以知道,IP delivery是正常的事,隐藏页面是作弊。搜索引擎所要求的并不是不允许使用IP delivery,而是不要把搜索引擎蜘蛛特殊处理。假设搜索引擎蜘蛛是来自纽约数据中心,网站返回的内容就应该是同样来自纽约的普通用户看到的内容,而 不应该返回一套无论来自哪里的普通内容都看不到的,只有搜索引擎蜘蛛才能看到的内容。

隐藏页面其实是相当危险的技术。比如说从大家不知道是属于Google的IP地址,发出与普通浏览器一样的访问请求,抓取页面,抓取的内容与来自同一地理位置的正常蜘蛛抓取的内容一比较,就知道是否存在cloaking。

(这篇文章是前几天写的。昨天看到Google网站管理员博客也翻译了原文,大家可以对比着看吧。)

作者: Zac@中新国外主机
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Zac的其他文章:
收藏本页到:
365Key | Yahoo! | 百度搜藏 | QQ书签 | Google Bookmark | del.icio.us




23 条评论来自

  1. JAPOD品牌 on 06月 12th, 2008

    ..这个问题真有点迷茫呢..再认真看看

  2. 好网123 on 06月 12th, 2008

    不错,google又进步了,特别讨厌这样的网站,我还这样给中了一次毒。

  3. 穿着打扮 on 06月 12th, 2008

    o 感谢ZAC的翻译

  4. 何苦 on 06月 12th, 2008

    具体操作的时候,只需考虑用户体验就可以了.

    具体的这些是否作弊,相信google可以做一些工作来做的更完善.

  5. 呆la on 06月 12th, 2008

    学习啦!

  6. espowbattery on 06月 12th, 2008

    晕乎乎的,好像没看懂

  7. fuzhuxian on 06月 12th, 2008

    这种作弊手法,对于SEO来说.真的那么重要吗?

  8. 易水萧寒 on 06月 12th, 2008

    意义不大

  9. 这个是作弊吗? on 06月 12th, 2008

    detail.zol.com.cn/desktop_pc_index/subcate27_list_1.html
    在google搜索电脑第一个就是这个网址,可是点击后就跳转了。

  10. 同乐共享 on 06月 12th, 2008

    这个需要了解下
    不过google内部的东西不一定公布出来的

  11. javascript on 06月 12th, 2008

    gg又下重手了

  12. dofus kamas on 06月 12th, 2008

    呵呵,这个还真不好判断

  13. AutoRunner on 06月 12th, 2008

    有一个更牛逼的作弊方法根本不像楼主说的这么复杂。只需要判断。。。嘿嘿。还是不说的好

    这种根据IP来判断的隐藏页面。目前SE还搞不定。哈哈。效果相当的好

  14. dj on 06月 13th, 2008

    危险的东西大家不要试验.嘿嘿.看看就好

  15. 上海情侣装专卖 on 06月 13th, 2008

    没看明白

  16. 大地 on 06月 14th, 2008

    这个分辨太难了,没有太明确的界限

  17. seo on 06月 14th, 2008

    不作弊很多年了

  18. 秋水共长天一色------大鹏 on 06月 14th, 2008

    MS这几日 百度人工干预了这个站哦 还有Z大哥 你就告诉大家你用了NO佛搂 标签好了 你看这么多人来这里做链接 呵呵

  19. intelsafe on 06月 16th, 2008

    来这里取经了!

  20. aihaowl on 06月 16th, 2008

    呵呵 ..
    我在似懂非懂中...

  21. 小叫兽 on 06月 27th, 2008

    感觉很多东西界定的都很模糊
    好像没有一个 固定的标准
    全是在道德了自律上面了

  22. haobound on 07月 15th, 2008

    界限不是很清楚,也许seo就是这样

  23. neekey on 08月 25th, 2008

    可以通过USER-AGENT判断搜索引擎