文章目录
你想获取知乎日报在某个话题下的所有回答吗?你想知道知乎用户对这些回答的点赞数排序吗?你想了解知乎用户在这些回答下的评论吗?
作者这一周利用空闲时间实现了一个知乎日报数据库的检索工具,知乎日报数据库包含了知乎日报从出现(2013.05.24)到现在(2016.12.01)的所有内容包括正文、受欢迎程度以及评论等,检索工具则实现了数据库结构、具体数据表内容、详细数据条目的展示以及最重要的文本搜索与受欢迎程度排序功能。
请将数据库文件拷贝到可执行文件所在文件夹中或者eclipse工程目录中,数据库文件命名:zhihudaily.db。
进一步数据挖掘待续…
话不多说,先上图一看。
资源
- 知乎日报数据库检索工具代码以及可执行文件:Chao’s Github
- 知乎日报数据库获取:百度网盘 Python爬虫
- SQLite数据库操作指南:网上课程
总结
- 一定要用好搜索引擎;
- 软件的结构一定要清晰,胸有成竹才能徐徐图之;
- 学习新知识时需要举一反三;
- 数据库指令格式很重要;
- 因为数据库 DELETE 命令只是清除数据标志位,所以需要利用 VACUUM 命令回收数据库空间;
- 一定要捕获程序中可处理的异常并进行合适的处理。



