lxml.etree,HTML使用xpath地址找不到元素

300 阅读1分钟
  1. 使用etree.HTML(response.text)里面的xpath地址找不到,切换成etree.HTML(response.content)里面的xpath地址就找到了

  2. response.text的内容是str类型 

  3. response.content的内容bytes类型

  4. 具体为什么不是很清楚,如果有知道为什么的可以评论一下。

  5. 检查过程:

    1. html = etree.HTML(response.text)
    2. print(etree.tostring(html))

发现最后打印的数据和之前打印的response.text不同,缺少了很多,使用response.content就解决了

开发者涨薪指南

48位大咖的思考法则、工作方式、逻辑体系