自动化爬取DirssionPage

422 阅读1分钟

可实现实现账号登录,跳转后获取新页面数据

from DrissionPage import ChromiumPage, ChromiumOptions

# 创建对象
page = ChromiumPage()
# 访问网页
page.get('https://www.baidu.com')
#启动页面监听,监听与 www.nmpa.gov.cn/datasearch相关的事件
page.listen.start('https://www.baidu.com')  #  监听
print(page.url)
# 百度的输入框id为kw  输入文本  DrissionPage
page('#kw').input('DrissionPage')
# 百度的查询框id为kw  点击按钮
page('#su').click()
# 等待页面跳转
page.wait.load_start()
#等待监听事件触发,并获取相关的响应结果。
res = page.listen.wait()   #  监听
print(res.url)             #  监听后得到的地址可看出来地址没加密
#可看到page代表的url变更了
print(page.url)
# 获取标签名称为h3的所有结果
links = page.eles('tag:h3')
# 遍历并打印结果
for link in links:
    print(link.text)
```
```