需求有几百多个站点要爬,不可能每个站点都用 Scrapy 写一个爬虫吧?
有没有什么有效的解决方案?
有没有什么有效的解决方案?
1
gitopen Jul 10, 2018 via Android
scrapy 可以写多个爬虫,自定义命令后可启动多个爬虫进行爬取。。。。
|
3
yrj Jul 10, 2018 via iPad
我想楼主是需要一个可以泛解析出内容页文章主体内容的库,我记得 python 有几个这样的库,但貌似准确率都不太高,我也一直在纠结这个问题。
|
4
cyspy Jul 10, 2018 via Android
pocket 或者 instapaper 能不能做中转?
|