事情是这样的,闲来无事,看看B站,做一个简单B站爬虫。这个爬虫非常简单。一看就会。 1、首先:爬取的页面是这个:www.bilibili.com/v/douga/mad… 2、然后打开开发者工具找到如下的JSON文件:
3、然后观察这个JSON链接的规律。写链接。
4、然后写头文件,注意这里的头文件是随机获取的库文件,不然你的爬虫就会被禁。
5、获取了json数据就是解析他啦。解析也很简单。观察json数据的规律解析就行啦。
6、最后数据就获取出来了,可以爬的数据很多,这里只给个案例。
7、最后本文只供学习使用。