Web Scraper爬虫工具(2)——采集1688供应商信息

267 阅读1分钟
  • 新建 sitemap

  • 新建对象Element

    • (需要注意是:采集多个内容一定要先添新建Element,再从Element里采集
    • 指定需要采集的数据
  • 点击 Scrape 开始采集

  • 点击 Export data 导出数据

新建 sitemap

  1. 打开开发者工具

  2. 选择 web scraper

  3. 选择 Create Sitemap
    点击Create Sitemap

  4. 在 Sitemap name 的位置

    • 输入supplier(可随意更改)
  5. 在 Start URL 输入需要采集的数据的网址

  6. 后点击 Create Sitemap
    在这里插入图片描述

新建对象Element

在这里插入图片描述

选项释义
Id选择器的名称
Type选择器的类型
Seletor指定需要采集的数据
Multiple如果需要采集多条数据,就勾选它

选择器使用可查看官方文档:
www.webscraper.io/documentati…

采集多条供应商信息

在这里插入图片描述

  1. 点击add select(id自己命名为supplier_block),选择Element选择器,点击select(选择所有供应商信息选区)
    在这里插入图片描述
  2. 点击supplier_block,点击add select(id为name),选择Text选择器,点击select(选择供应商名称)
    在这里插入图片描述
    3.依次add select地址、面积、人数
    在这里插入图片描述
    右上角点击data preview进行数据预览

点击 Scrape 开始采集

在这里插入图片描述
点击刷新数据
在这里插入图片描述
浏览采集的数据
在这里插入图片描述

点击 Export data 导出数据

在这里插入图片描述

下一步改进

  • 采集多页数据