首页 > SEO行业新闻 > 网址规范化问题最新解决方法

网址规范化问题最新解决方法

作者:Zac 时间:2009年2月18日

网址规范化一直是困扰站长以及搜索引擎的一个问题。据估计,网上有10%-30%的URL是内容相同但URL不一样的不规范化网址。

这就造成几个问题。比如:

  • 对站长来说,多个URL存在分散了页面权重,不利于排名。
  • 对搜索引擎来说,浪费资源,浪费带宽。
  • 搜索引擎发现多个网址内容相同时,不会惩罚,而会尽可能找出那个应该是规范化的网址。但程序毕竟只是程序,可能出错,挑出来的可能不是站长想要的那个规范化网址。
  • 网站上网址规范化问题太严重的话,也可能影响收录。一个权重不很高的域名,能收录的总页面数字是有限的。搜索引擎把资源花在收录不规范的网址上,留下给真正不同内容的资源就减少了。

要解决URL规范化问题也有很多选项,比如:

  • 在Google管理员工具中设置带3W和不带3W的,哪一个是规范化版本
  • 使用301转向,把不规范化URL全部转向到规范化URL
  • 确保使用的CMS系统只产生规范化网址
  • 确保网站上所有内部链接都指向规范化网址
  • 在提交给搜索引擎的网站地图中全部指定规范化网址

但这些方法都各有局限。

  • Google管理员工具不适用于其他搜索引擎
  • 有的站长因为某种原因做不了301转向
  • CMS系统大部分情况下不受自己控制
  • 内部链接自己可以控制,但其他人链接到自己网站上就不受控制了

总之,虽然有解决方法备选,但网址规范化到目前为止还是个不小的问题。

前几天Google,雅虎,微软共同发布了一个新的标签canonical tag,用于解决网址规范化问题。

简单说,就是在HTML文件的头部加上这样一段代码:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />

意义就是这个网页的规范化网址应该是:

http://www.example.com/product.php?item=swedish-fish

下面这些URL都可以加上这段代码:

http://www.example.com/product.php?item=swedish-fish&category=gummy-candy

http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

这些URL的真正规范化网址就都成为:

http://www.example.com/product.php?item=swedish-fish

简单说,这个标签相当是一个页面内的301转向。区别在于用户并不被转向,还是停留在不变网址上,而搜索引擎会把它当作是301转向处理,也就是说把页面链接的权重都集中到代码中指明的规范化网址上。

另外有几个细节站长需要注意:

  • 这个标签只是一种建议或暗示,而不是指令,它不像robots文件那样是个指令。所以搜索引擎会很大程度上考虑这个代码,但并不是百分之百,还会考虑其他情况来判断规范化网址。这也防止站长有可能把网址弄错。
  • 这段代码既可以使用绝对地址,也可以使用相对地址。通常还是建议使用绝对地址比较保险。
  • 指定的规范化网址上的内容,与其他使用这段代码的非规范化网址内容可以有一些不同,不一定完全一样。比如在电子商务网站上有很多按价钱、颜色,、尺寸升降排序,生成的URL全都不一样,但内容大体相同,只有细小区别,就可以使用这个标签。
  • 指定的规范化网址可以是不存在页面,返回404,也可以是还没有被收录的页面。但是不建议这么做,别没事找事。
  • 这个标签适用于同一个域名内,包括二级域名。但不适用于不同域名之间,防止有人劫持。
  • 别把这个标签当救命草,首先还是得把网站结构做好,尽量避免出现URL规范化问题。这只是最后万不得已的方法。

敏感的人大概能从这个新标准里看到建立大量外部链接的机会。

最后提一句,这个标准被3大搜索引擎Google,雅虎,微软同时支持,为什么没提百度呢?记得看到报道,从搜索量来看,百度是世界上第二大搜索引擎,为什么不带着我们一起玩?

作者: Zac@SEO每天一贴
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。

Zac的其他文章:

SEO行业新闻

  1. 2009年2月18日10:58 | #1

    没有题目啊.小哥

  2. 2009年2月18日11:39 | #2

    很好,很好,希望百度也发扬光大......

  3. 2009年2月18日11:47 | #3

    靠,被国外n多媒体误导了,居然有媒体说这个东西和避免别的网站抄袭自己网站的内容,可以让自己网站内容形成权威。

  4. 一片天
    2009年2月18日11:50 | #4

    百度在跟随标准方面要加强,以免走更多弯路,

  5. 2009年2月18日12:12 | #5

    感觉还是没有用301好啊

  6. 2009年2月18日12:16 | #6

    基本同意,不过说的有点笼统!

  7. 2009年2月18日15:27 | #7

    关键是百度不支持这样的标准,我们也没招

  8. 2009年2月18日15:34 | #8

    受教了~有时间再看一遍,仔细琢磨一下~

  9. 50boke.cn
    2009年2月18日15:39 | #9

    经常关注点石
    这个代码要试试

  10. 2009年2月18日17:10 | #10

    敏感的人大概能从这个新标准里看到建立大量外部链接的机会。

    从头看到尾,我只对上面这句感兴趣

  11. 2009年2月18日18:21 | #11

    ZAC总走在前面~~

  12. 2009年2月18日20:01 | #12

    这个很好.正是我需要的.非常感谢.

  13. 2009年2月18日20:14 | #13

    中文搜索里,google会直接显示URL里的中文内容,针对中文搜索,规范网址是否考虑中文关键词内容?

  14. 2009年2月18日21:22 | #14

    是不是就是说这些规范化只对google排名有效果不规范不影响其他引擎

  15. 2009年2月19日00:49 | #15

    这个问题太多了

  16. 2009年2月19日09:10 | #16

    我个人比较喜欢能自定义文件名的cms,这样就是为了做到和别人不一样。

    ps:3月份估计就能当面膜拜下zac啦。呵呵。

  17. 2009年2月19日09:58 | #17

    我们平时做的商务网站应该不用加这个标准吧
    加了对排名有影响吗?

  18. chxwei
    2009年2月19日10:27 | #18

    这三个毕竟是国际上都在使用的,百度国内份额比较大,或者人家压根瞧不上百度。

  19. 2009年2月19日12:45 | #19

    这个可以当成301转向,不错,那很多页面的流量都可以集中到一个页面欺骗搜索引擎喽

  20. 2009年2月19日13:50 | #20

    这个不好做呢

  21. 2009年2月19日14:58 | #21

    哇!的确有遇到这个问题,特别是php的博客和discuz论坛中都有这个问题需要解决. 谢谢zac

  22. 菜鸟
    2009年2月19日16:18 | #22

    敏感的人大概能从这个新标准里看到建立大量外部链接的机会
    谁来说说咋回事啊。。

  23. 2009年2月19日17:20 | #23

    这两天也遇到了这样的麻烦,俺的甲春博客生成的网页有时候有两个网址,或者有时候我调整了,生产了两个网址。但是内容是一样的。

  24. 2009年2月19日17:20 | #24

    海外推广比较有用

  25. 2009年2月20日08:59 | #25

    说不定,百度就是说我就是要和你们不一样,怕他们争夺中国的市场,呵呵

  26. 2009年2月20日09:00 | #26

    非常有意思的东西。做好网站才是根本。

  27. 2009年2月20日11:40 | #27

    在Google管理员工具中设置带3W和不带3W的,哪一个是规范化版本
    使用301转向,把不规范化URL全部转向到规范化URL
    确保使用的CMS系统只产生规范化网址
    确保网站上所有内部链接www.163qian.cn都指向规范化网址
    在提交给搜索引擎的网站地图中全部指定规范化网址

  28. 2009年2月20日15:24 | #28

    学习了,就是不太了解!

  29. 2009年2月20日23:47 | #29

    国内站用拼音好点

  30. 2009年2月21日13:02 | #30

    百度违背搜索引擎的创建目的,本身在自然排名里混杂这人工干预,这点是我最讨厌的!!!

  31. 2009年2月22日21:15 | #31

    什么时候百度也加入到定规则的队伍中啊

  32. 2009年2月24日08:58 | #32

    又学习到一些有用的知识,谢谢。

  33. 2009年2月25日09:49 | #33

    也有可能是百度比较强,不陪他们玩呢 :-)

  34. 2009年2月25日11:42 | #34

    zac说“敏感的人大概能从这个新标准里看到建立大量外部链接的机会。” 我想了几天还是没能发现

  35. 2009年2月25日20:00 | #35

    感觉百度老是一意孤行,自以为国内老大就牛得不行了

  36. 2009年2月26日11:00 | #36

    三家联合声明为什么没有百度呢,我想知道,有没有人知道的呢

  37. 2009年2月27日12:58 | #37

    我猜这个标签.一定不支持跨域吧.

  38. 2009年2月27日20:40 | #38

    百度最近的一些做法很难让人懂
    是不是被央视曝光后 在改?

  39. 2009年2月27日23:21 | #39

    有时候自己也搞不清楚,为什么搜索引擎就不显示3W。

  40. 2009年2月28日10:48 | #40

    google一直在引导用户向他的标准靠近,这与微软引导用户使用他的windows一样,但是国内百度好象不理这个东西.

  41. 2009年2月28日12:03 | #41

    从今天起,开始使用Google……

  42. 2009年2月28日20:53 | #42

    不支持跨域,不过支持跨二级域名

  43. 2009年3月1日00:36 | #43

    学习一下,貌似很久没更新了,期待中

  44. 2009年3月1日17:34 | #44

    关于建议外部链接那句话,也是很久没有想明白.

  45. 2009年3月1日22:37 | #45

    为什么没有百度呢??

  46. 2009年3月2日22:24 | #46

    呵呵,感觉大都是为了大网站或超大网站SEO准备的

    我是小站长,没有超过1万网页的网站

  47. 2009年3月5日14:58 | #47

    呵呵 个人博客就不考虑这个了。

  48. 2009年3月11日09:02 | #48

    百度就像我国GDP一样没有了垄断他什么都不是

  49. rldsy
    2009年3月13日18:02 | #49

    这种情况很早前就遇到过……

  50. 2009年3月16日10:03 | #50

    就不带他玩

  51. 2009年3月17日16:26 | #51

    百度...
    哈是Google好啊.....

  52. 2009年3月18日15:10 | #52

    没办法,用的人多

  1. 目前还没有任何 trackbacks 和 pingbacks.
本文的评论功能被关闭了.