lxml.etree,HTML使用xpath地址找不到元素

柚子味儿的西瓜

2022-06-09 340 阅读1分钟

使用etree.HTML(response.text)里面的xpath地址找不到，切换成etree.HTML(response.content)里面的xpath地址就找到了
response.text的内容是str类型
response.content的内容bytes类型
具体为什么不是很清楚，如果有知道为什么的可以评论一下。
检查过程：
1. html = etree.HTML(response.text)
2. print(etree.tostring(html))

发现最后打印的数据和之前打印的response.text不同，缺少了很多，使用response.content就解决了

开发者涨薪指南

48位大咖的思考法则、工作方式、逻辑体系