标题: 中文搜索引擎对discuz收录存在的一些问题
bmt
金牌会员
Rank: 6Rank: 6
纸上谈兵



UID 506
精华 1
积分 1467
帖子 1749
阅读权限 70
注册 2006-9-30
来自 北京乡下
状态 在线
发表于 2007-3-10 10:50  资料  短消息  加为好友  QQ
中文搜索引擎对discuz收录存在的一些问题

记录一下相继发现的问题 ...[l{f0e3_

N8dF"Bve-S
r/?www.dunsh.org
baidu
}]1f4Ua9_自2006年11月下旬起,对 thread-(tid)-(page)-(forumdisplay page).html 形式的伪静态地址,最后一项forumdispay page本应是1,但是它会先收录"0"的形式,"1"也会检索的,形成复制网页,最后会根据其它的链接引用将其中一种列为补充。www.dunsh.orgaa O.~RE
*今年3月以后的新帖的收录应该没问题了
BCI*W)N7]www.dunsh.orgr(o9ll&r
sogou
XwFa;z.ak^今年三月七起对所有 thread-(tid)-(page)-(forumdisplay page).html 链接检索不到内容,标题显示:无标题,快照也无内容qk'V
tkx6T

*大约一周时间,恢复正常
E3lcyYB1`(s
p-] Qi
hi
[ 本帖最后由 bmt 于 2007-3-28 10:34 AM 编辑 ]

顶部
国宝
超级版主
Rank: 8Rank: 8


UID 108
精华 3
积分 1706
帖子 2320
阅读权限 150
注册 2006-9-1
来自 温哥华
状态 在线
发表于 2007-3-13 01:39  资料  短消息  加为好友 
-如果没有0这个形态的url存在于网页中,比如本贴的重复url形式“http://www.dunsh.org/forums/thread-3742-1-0.html”,应该是收录不到这种url的啊...
2z        e2ub+_vN!bwww.dunsh.org
r*c{5a0{-sogou没研究,3月之前的收录没问题吧?





长得比较丑的那一面是坏人...
顶部
bmt
金牌会员
Rank: 6Rank: 6
纸上谈兵



UID 506
精华 1
积分 1467
帖子 1749
阅读权限 70
注册 2006-9-30
来自 北京乡下
状态 在线
发表于 2007-3-14 13:14  资料  短消息  加为好友  QQ
在实际中,确实是找不到thread-3742-1-0.html这个形式的链接,但是baidu的机器人确最先抓这个;Es9_\ ]B4L"R
开始我以为是程序改错了,后来查看了 www.dunsh.org/forums/www.discuz.net 的收录情况,才知道是baidu 收录的问题
?*p ABK2N1k u\www.dunsh.org
9w-J1l`{9y+Z.[sogou在3月7日前的收录没问题。www.dunsh.orgkoFM4O1s
@c\

只是检测程序改得有没问题和查看有没有其它的链接才经常观察各搜索引擎对discuz的收录情况y(u$^6x@&x|Y#o

"V3\(C)E.w6z[ 本帖最后由 bmt 于 2007-3-14 01:22 PM 编辑 ]

顶部
国宝
超级版主
Rank: 8Rank: 8


UID 108
精华 3
积分 1706
帖子 2320
阅读权限 150
注册 2006-9-1
来自 温哥华
状态 在线
发表于 2007-3-15 02:08  资料  短消息  加为好友 
嗯,同样的情况我过去处理过,因为担心竞争对手用URL附加随机生产参数的形式 对网站做出破坏,在一个项目中,用php程序模块实现将所有不正当形式的URL访问都301到正当的上,比如“http://www.dunsh.org/forums/thread-3742-1-324234.html”的形式都301转到“http://www.dunsh.org/forums/thread-3742-1-1.html”上。
2eH9z*r9v"i.y
O!j
QN&V]
PS. 同时也考虑到 affiliate 过来的url带来的附加参数是有用的,所以会将某些特定参数保存在session中再301...





长得比较丑的那一面是坏人...
顶部
bmt
金牌会员
Rank: 6Rank: 6
纸上谈兵



UID 506
精华 1
积分 1467
帖子 1749
阅读权限 70
注册 2006-9-30
来自 北京乡下
状态 在线
发表于 2007-3-16 10:41  资料  短消息  加为好友  QQ
学到个害人的方法
/bRcaw6w R-CI)w+eNo
[ 本帖最后由 bmt 于 2007-3-16 10:52 AM 编辑 ]

顶部
blank (songt)
版主
Rank: 7Rank: 7Rank: 7


UID 229
精华 1
积分 594
帖子 627
阅读权限 100
注册 2006-9-5
来自 浙江水乡
状态 离线
发表于 2007-3-28 08:54  资料  短消息  加为好友  添加 blank 为MSN好友 通过MSN和 blank 交谈 QQ
大家都在玩PHP了,咱还在JSP上转,落伍了!





Mr'Seo Blank 小黑窝……Better late than the late
顶部
星箭
管理员
Rank: 9Rank: 9Rank: 9


UID 493
精华 0
积分 1949
帖子 2408
阅读权限 200
注册 2006-9-29
来自 北京
状态 离线
发表于 2007-3-28 09:15  资料  主页 短消息  加为好友  添加 星箭 为MSN好友 通过MSN和 星箭 交谈 QQ
偶翻了十多页,没发现还存在这个问题了~~





星箭SEO博客<--禁止点击此链接,违者罚款300元
顶部
 



当前时区 GMT+8, 现在时间是 2009-7-4 15:56
渝ICP备06007279号


    本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0  © 2001-2007 Comsenz Inc.
Processed in 0.041345 second(s), 6 queries

清除 Cookies - 联系我们 - 点石互动 - Archiver - WAP