爬取页面:全国建筑市场监管公共服务平台(四库一平台) (mohurd.gov.cn)
目标要数据
爬取流程
锁定包
直接在包中搜索数据,发现并不能找到,可确定其数据经过加密。在送请求的第一个url并未返回有关该内容的数据,故观察【fetch/xhr】的包里面是否会出现有关内容。
打开这几个包,可发现其内容都经过加密。
在搜索栏中找JSON.parse,一般对数据进行解密的操作,大部分用到此字符串(做函数名)。
进而定位到这两个位置。
断点进行调试确定解密位置。
打开这几个包,可发现其内容都经过加密。
在搜索栏中找JSON.parse,一般对数据进行解密的操作,大部分用到此字符串(做函数名)。
断点进行调试确定解密位置。