本人已参与【新人创作礼】活动,一起开启掘金创作之路。 本文首发于CSDN
hello,大家好,我是wangzirui32,今天我们来学习如何用sqlite3模块操作Google Chrome浏览器浏览历史,开始学习吧!
1. 浏览记录数据库
Google Chrome浏览器的浏览记录数据库可以在
C:\Users\wangzirui32\AppData\Local\Google\Chrome\User Data\Default
文件夹中看到,如图:
可以看到,数据库文件为History
,这个文件没有后缀名,但它本质上是一个Sqlite数据库,可以用Python内置模块读取。
2. 数据库结构
数据库中的urls表存储了相关的浏览记录,如图:
现在,我们要通过Python获取到id
,url
和title
数据项。
3. 读取记录代码
from sqlite3 import Connection
# 数据库路径
database_path = r"C:\Users\wangzirui32\AppData\Local\Google\Chrome\User Data\Default\History"
# 创建数据库连接并创建光标
conn = Connection(database_path)
cursor = conn.cursor()
# 执行查询语句
urls = cursor.execute("select id, url, title from urls").fetchall()
for i in urls:
print(i[0], i[1], i[2])
# 关闭连接和光标
cursor.close()
conn.close()
运行代码,输出:
1 https://blog.csdn.net/ CSDN博客 - 专业IT技术发表平台
2 https://passport.csdn.net/account/login?spm=1001.2100.3001.5105 CSDN-专业IT技术社区-登录
3 https://passport.csdn.net/login?code=mobile CSDN-专业IT技术社区-登录
4 https://passport.csdn.net/login?code=account CSDN-专业IT技术社区-登录
5 https://baidu.com/ 百度一下,你就知道
6 https://www.baidu.com/ 百度一下,你就知道
7 https://www.baidu.com/s?cl=3&tn=baidutop10&fr=top1000&wd=%E7%A5%9D%E8%99&rsv_idx=2&rsv_dl=fyb_n_homepage&hisfilter=1 祝融号带你看火岩火尘火沙_百度搜索
8 https://baijiahao.baidu.com/s?id=1704798467045507333&wfr=spider&for=pc 祝融号火星车行驶里程超300米,带你看火岩、火尘等高清大图
9 https://github.com/ GitHub
10 https://github.com/login GitHub
11 https://github.com/wangzirui32/wzr_spider wangzirui32/wzr_spider: 一个简单的爬虫框架。
4. 删除记录代码
这里以删除id为11的一项作为示例:
from sqlite3 import Connection
# 数据库路径
database_path = r"C:\Users\wangzirui32\AppData\Local\Google\Chrome\User Data\Default\History"
# 创建数据库连接并创建光标
conn = Connection(database_path)
cursor = conn.cursor()
# 执行删除语句
cursor.execute("delete from urls where id=11")
conn.commit()
# 关闭连接和光标
cursor.close()
conn.close()
好了,今天的课程就到这里,我是wangzirui32,喜欢的可以点个收藏和关注,我们下次再见!