爬虫 - YAn84000的收藏集 - 掘金

爬虫

更多收藏集

4篇文章 · 0订阅

Python 爬虫利器五之 Selenium 的用法

Selenium 是什么？一句话，自动化测试工具。它支持各种浏览器，包括 Chrome，Safari，Firefox 等主流界面式浏览器，如果你在这些浏览器里面安装一个 Selenium 的插件，那么便可以方便地实现 Web 界面的测试。换句话说叫 Selenium 支持这些浏览器驱动。话说回来，PhantomJS 不也是一个浏览器吗，那么 Selenium 支持不？答案是肯定的，这样二者便可以实现无缝对接了。

Geedio
9年前
1.7k
36
评论

[译] 30 分钟 Python 爬虫教程

一直想用 Python 和 Selenium 写一个网页爬虫，但一直都没去实现。直到几天前我才决定动手实现它。写代码从 Unsplash 网站上抓取一些漂亮的图片，这看起来好像是非常艰巨的事情，但实际上却是极其简单。以上的所有都安装好了？棒！在我们继续开始写代码前，我先来解释…

kezhenxu94
8年前
13k
69
评论

Python如何爬取实时变化的WebSocket数据

作为一名爬虫工程师，在工作中常常会遇到爬取实时数据的需求，比如体育赛事实时数据、股市实时数据或币圈实时变化的数据。如下图： Web 领域中，用于实现数据'实时'更新的手段有轮询和 WebSocket 这两种。轮询指的是客户端按照一定时间间隔（如 1 秒）访问服务端接口，从而达到…

已注销
7年前
14k
109
17

Python搭建代理池爬取拉勾网招聘信息

我们的目的是抓取拉勾网的招聘信息。拉勾网武汉站 Python 招聘信息 ok,明白了我们要抓取的数据,下一步就是要找数据的来源了。我们发现这个请求正是招聘数据的来源，这样只要我们之间请求这个接口就可以得来数据了。再回到控制台看看这个请求，发现是需要携带 cookie 的，…

calmHarbin
6年前
2.0k
14
评论