Scrapy - 陆陆陆啊的收藏集 - 掘金

Scrapy

更多收藏集

1篇文章 · 0订阅

利用 Scrapy 爬取所有知乎用户详细信息并存至 MongoDB

如果我们从一个大 V 开始，首先可以获取他的个人信息，然后我们获取他的粉丝列表和关注列表，然后遍历列表中的每一个用户，进一步抓取每一个用户的信息还有他们各自的粉丝列表和关注列表，然后再进一步遍历获取到的列表中的每一个用户，进一步抓取他们的信息和关注粉丝列表，循环往复，不断递归，这样就可以做到一爬百，百爬万，万爬百万，通过社交关系自然形成了一个爬取网，这样就可以爬到所有的用户信息了。

腾讯云开发者
8年前
2.2k
75
3