scrapy工作流程
-
engine向spider请求第一个url
-
spider向engine发送
-
engine让scheduler对request排序
-
scheduler将排序后的request返给engine
-
engine让downloader下载request
-
downloader下载好将response传给engine
-
engine将response交给spider去处理
-
spider处理后得到需继续跟进的url,还有解析获取得到的item,交个engine
-
engine将request交给scheduler处理,将item交给itempipelines