广告联盟网

 找回密码
 注册
楼主: hay
打印 上一主题 下一主题

我正在做的一个采集器

[复制链接]
1#
发表于 2006-11-3 | 显示全部楼层
呵呵,看来你写的还挺好的嘛。功能强大。

我就笨了点,呵呵,我的是放在服务器上面的,自动采集入库,自动生成html 还有sitemaps.xml

每天早上五点开始放出蜘蛛到处爬。
2#
发表于 2006-11-3 | 显示全部楼层
独立的采集  不知道有啥子好。

每天都要手动采集,麻烦。
3#
发表于 2006-11-3 | 显示全部楼层
晕,我给我的主站每天定量采集更新50个。

质量很高。完全不用手动。出现可预计的错误 可以判断的乱码类的。

主站一天也更新不多,三五篇文章或者其它。
4#
发表于 2006-11-5 | 显示全部楼层
晕,我感觉采集器应该是个“寄生虫”而不是文本筛选器。

呵呵。大概就是大站更新了,寄生虫程序就跟着更新,如果没更新,那我也不更新。

同时多个频道,多线程实现程序http读文本。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|广告联盟网  

GMT, 2024-6-15 , Processed in 0.073172 second(s), 19 queries .

Powered by Discuz! X3.2

© 2005-2021 www.ggads.com GGADS 广告联盟网

快速回复 返回顶部 返回列表