scrapy工作流程描述（python）

2021-10-23 137 阅读1分钟

scrapy工作流程

engine向spider请求第一个url
spider向engine发送
engine让scheduler对request排序
scheduler将排序后的request返给engine
engine让downloader下载request
downloader下载好将response传给engine
engine将response交给spider去处理
spider处理后得到需继续跟进的url，还有解析获取得到的item，交个engine
engine将request交给scheduler处理，将item交给itempipelines

... ...开始循环直至调度器中没有待处理的request，下载失败的url会重新被下载