稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
爬虫
订阅
avatar
undefined在掘金36409
更多收藏集

微信扫码分享

微信
新浪微博
QQ

6篇文章 · 0订阅
  • Scrapy框架的使用之Scrapy通用爬虫
    通过Scrapy,我们可以轻松地完成一个站点爬虫的编写。但如果抓取的站点量非常大,比如爬取各大媒体的新闻信息,多个Spider则可能包含很多重复代码。 如果我们将各个站点的Spider的公共部分保留下来,不同的部分提取出来作为单独的配置,如爬取规则、页面解析方式等抽离出来做成一…
    • 崔庆才丨静觅
    • 7年前
    • 9.2k
    • 49
    • 5
    爬虫 Scrapy JSON
  • scrapy-redis实现分布式爬虫
    Scheduler调度器从redis获取请求的url地址,传递给Downloader下载器下载数据网页,然后把数据网页传递给spiders爬虫提取数据逻辑器处理,最后把结构化保存数据的item数据对象经过itemPipeLine保存在redis数据库。 其他机器的item Pr…
    • Harhao
    • 6年前
    • 2.5k
    • 5
    • 评论
    Scrapy
    scrapy-redis实现分布式爬虫