Feapder
# 源码解读 # Spider 分布式爬虫 Spider 继承 BaseParser, Scheduler # 运行流程 初始化 Spider (传入 rediskey), 此时会初始化 Spider 中的参数,以及 Scheduler 中的参数,调用多线程中的 start 方法 在 start 方法中,将当前 Spider 对象存入 self._parsers 中,然后调用 Scheduler 中的_start 方法 在_start 方法中,调用初始化后的 request_buffer,item_buffer,collector 的 start 方法 接着根据线程数及进程数,开启多个...
more...