midway+cherio 爬取网页信息学习

88 阅读1分钟

一、学习目标:

初步了解Midway并完成开发和单元测试

学习内容:

完成一个小作业,过程中学习到:

Midway框架

单元测试框架Jest

Actions:

  1. 在本地电脑,初始化一个空的Midway3.0框架项目

  2. 在src/controller/home.ts代码文件里,写一个简单的网页抓取分析逻辑

  3. 使用node内置的http模块,或者第三方的npm库,通过GET请求,获取"百度一下,你就知道" 网页的HTML源代码文本

  4. 从获取的HTML源代码文本里,解析出id=lg的div标签里面的img标签

  5. 返回此img标签上的src属性值

  6. 在test/controller/home.test.ts代码文件里,写一个针对src/controller/home.ts的单元测试案例

  7. 使用Jest或Mocha测试框架

  8. 如果接口请求时间超过1秒钟,则Assert断言失败

  9. 如果接口返回值不等于"//www.baidu.com/img/bd_logo… 则Assert断言失败


二、学习资料:

midway介绍

Jest框架介绍


三、学习过程中的问题:

获取到网页上的src标签

如何异步得到网页返回的内容

测试如何断言

demo工程地址:github.com/MichelleWai…