hackhu - 2008-8-17 23:09:00
我今天把NETCMS的采集分离出来后,发现NETCMS的采集存在着很多缺陷啊。可以想到****也同样有这样的问题。让人有点失望。
举例两点,
一、标题相同则不重复采集,应该是地址相同不重复采集啊,我们采集的东西有很多标题是一样的,那这样就导致标题相同但内容不同的新闻就不能采集了。
二、NETCMS的采集,是一个任务提交后,要完全采集好,才会停止,比如要采集100篇文章,那么当我们提交后,他必须要在一个回传过程中把100条都采集到数据库,这样就很容易超时,这个问题很严重啊。应该学习一下动易ASP的方法,采集一条信息,一个回传,这样就不会超时了。
只是个人意见,希望官方看到后,应该可以出一个相关的补丁。
zj_chengwa - 2008-8-26 13:59:00
..l..建议很好`
不过有些问题还需要好好的考虑