全国建筑市场爬虫

384 阅读1分钟

爬取页面:全国建筑市场监管公共服务平台(四库一平台) (mohurd.gov.cn)

目标要数据

image.png

爬取流程

锁定包

image.png

image.png

image.png

直接在包中搜索数据,发现并不能找到,可确定其数据经过加密。在送请求的第一个url并未返回有关该内容的数据,故观察【fetch/xhr】的包里面是否会出现有关内容。

image.png 打开这几个包,可发现其内容都经过加密。 在搜索栏中找JSON.parse,一般对数据进行解密的操作,大部分用到此字符串(做函数名)。 image.png

进而定位到这两个位置。

image.png 断点进行调试确定解密位置。

image.png

image.png

确定加密位置进一步观察解密方式

image.png

确定解密密函数

image.png

观察此加密函数,确定为数据为AES加密,CBC模式进而得到密钥'Dt8j9wGw%6HbxfFn',偏移量0123456789ABCDEF.后面的如何解密自己写。