基于 Wappalyzer 的 Api 服务

1,935 阅读1分钟

Wappalyzer可以帮你轻松探测到别家网站采用的技术栈,做信息采集的时候十分有用

由于找到的开源版Wappalyzer都没chrome插件探测出来的准确

所以基于chrome插件修改了这么个版本出来

原理

下载crx源文件,直接解压,添加代码使其探测完成后传回服务器

利用selenium,装载插件访问网页得到数据

通过API进行数据传输

安装

环境:python3.6 redis chrome node selenium

目前Wappalyzer插件版本: 2.51

# 安装selenium
npm install -g selenium-standalone

selenium-standalone install
# 国内请使用
selenium-standalone install --drivers.chrome.baseURL=https://npm.taobao.org/mirrors/chromedriver --baseURL=https://npm.taobao.org/mirrors/selenium --drivers.firefox.baseURL=https://npm.taobao.org/mirrors/geckodriver
# 开启selenium
selenium-standalone start

# 安装python3依赖
pip3 install -r requirements.txt

# 后台启动
./start.sh

接口

请求任务

path:   /task
method: POST
type:   json
@example:
{
    "urls":["https://www.baidu.com/"]
}
return: 任务ID

获取结果

path:   /status/<task_id>
method: GET
type:   json
@example:
{
    "urls":["https://www.baidu.com/"]
}
return: 处理结果,{
            'scan': 0,
            'apps': []
        }

TODO

  • 打包docker
  • 添加代理
  • 多线程(是否有必要?