URL网址规范化
网址URL规范化(URL canonicalization)是近一年来在Google搜索结果中出现的一个很大的问题。它指的是搜索引擎挑选最好的URL网址作为真正网址的过程。
举例来说,下面这几个URL一般来说指的是同一个文件或网页:
http://www.domainname.com
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html
但是从技术上来讲,这几个URL网址都是不同的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是你的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。
当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个最好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。很可能在你的网站上,一会连到URL http://www.domainname.com,一会儿连到URL http://www.domainname.com/index.html 。
虽然这不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对Google来说却是造成了困惑,哪一个网址是你真正的主页呢?如果在你的网站上,不同的版本网址都大量出现,那么这两个URL可能都会被Google收录进数据库,这时就会造成复制内容网页。
所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。
当你的网站出现网址URL规范化问题的时候,就有可能造成被怀疑为复制网页,因而影响搜索引擎结果排名。
从站长的角度来考虑,你应该做两件事:
1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。
2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。也就是说,从下面这几个网址
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html
都要做301重定向到这个网址
http://www.domainname.com
很重要的一点是,如果你的网站出现了URL规范化的问题,千万不能使用Google的网址删除反馈表,来要求删除其中的一个网址版本。比如说,你所要的是带有www的版本
http://www.domainname.com
你千万不能到Google的网站上填表,要求没有www的主页网址
http://domainname.com
被删除掉。因为那样做的话,你整个的域名有可能被删除6个月。
当然,除了包含www和不包含www的两个版本以外,还有其他类型的URL规范化问题。比如有的时候,搜索引擎会去掉或加上网址尾端最后的斜线。有 的时候会尝试把大写字母换成小写字母,有的时候可能尝试去掉会话ID(session ID)等等,这些都有可能造成网址规范化问题。
作者: Zac
原载: 点石互动搜索引擎优化博客
版权所有,转载时必须以链接形式注明作者和原始出处及本声明。
- SEO服务前景不妙 - 2008-05-08
- Google PR更新中 - 2008-04-30
- 关于李彦宏讲话的澄清 - 2008-04-29
- 为了胜利,向我开炮! - 2008-04-24
- 为祖国而战 - 2008-04-21












又学一招!
谢谢! 不错
最近刚开始学习seo,感觉点石的很不错.
看了这篇文章我有个疑问,如果我想用301重定向将一个pr5的网址定向到一个pr4的网址,会降低pr值么?如果会的话,那么如果想要让这个pr4的网址能较快的追上甚至是超过这个pr5的网址该如何做呢?请赐教.谢谢
非常感谢ZAC,,看了这篇文章,解决了我一个大问题.
...曾经差点误操作删除 一个路径的页面。
google没有通过,因为,我那个页面依旧存在!
网络推广企业必不可少。
网络营销企业的必经之路!
由于业务需要,我需要将来源网站的别名信息
作为用户信息的一部分,于是我把外链接设置成了:
http://www.我的域名.com/index.asp?s=来源网站的拼音简写
所以请问:
1:这样会引起URL网址规范问题吗?
2:会影响排名吗?。
3:如果会如何补救?
归纳得好,谢谢楼主
呵呵,看来301的用处还是挺大的嘛.
写的很好,收藏了...很多网站现在的URL还有多个版本,这样效果确实不理想.
只留一个 应该也就不会有那么多的问题了。