Python爬虫爬取豆瓣书籍数据

3,096 阅读1分钟

阅读文本大概需要 5 分钟

此文首发于「Python知识圈」公众号,欢迎大家去关注。

炎热的夏天,酷暑难挡,难免会心烦意燥,睡前随手拿起枕边看过很多遍的「平凡的世界」。看书,会让躁动的心瞬间安静下来。

生活不能等待别人来安排,要自己去争取和奋斗;而不论其结果是喜是悲,但可以慰藉的是,你总不枉在这世界上活了一场。有了这样的认识,你就会珍重生活,而不会玩世不恭;同时,也会给人自身注入一种强大的内在力量。
——路遥 《平凡的世界》

读完一本书后,是不是发现找不到合适的书看了?今天就给大家分享下怎么用 python 爬虫找出你中意的书。

今天的目标网站是豆瓣读书,把豆瓣读书里的书本信息爬取下来,保存为 csv 文件,保存的信息包括:书籍类型、书籍名称、作者、译者、豆瓣评分、出版社、出版日期、评价人数、价格、简介。

爬取结果:


项目环境

语言环境:python 3.6
编辑工具:PyCharm
导包:requests、BeautifulSoup、time、random、csv


全部文章请  点击这里查看