python爬取

304 阅读1分钟

爬虫四个主要步骤:

1.明确目标:要爬取得目标网站;

2.爬:将所有的目标网站的内容全部爬(下载)下来;

3.取(过滤):在爬下来的网站内容中去掉对我们没有用处的数据,只留取我们需要的数据;

4.处理数据:按照我们想要的方式存储和使用留取的数据