引言
说到es6,一帮前端大佬可能会跳出来说:"es6真是太优雅了,解构赋值、正则表达式的扩展、Symbol Map Set等数据类型、Class语法糖、Promise、aysnc等等等等....",说了这么多,请问这些资料是哪里看来的呢,没猜错的话,基本都是从"阮一峰大神的ECMAScript 6 入门"获取的知识。那么,如果我想把在线文档变成本地的PDF该怎么办呢。。。这就用到伟大的爬虫技术啦。
话不多说,先贴我们用到的node的一个爬虫模块"puppeteer":github.com/GoogleChrom…
开工
cnpm install --save puppeteer // 一看package.json依赖包,puppeteer: ^1.19.0,没错最新版本。这时候你是不是很开心,爬虫模块装好了。
接下来直接贴代码吧(注释还是比较详细的)
(哈哈,别问我为什么截图,不贴代码)
在你当前项目目录下, node XXX.js 回车一按。。。妈耶怎么有个error。
error详情如下:(node:7780) UnhandledPromiseRejectionWarning: Error: Protocol error (IO.read): I nvalid parameters handle: string value expected
各种log,各种debugger,似乎仍然找不到解决方案。那怎么办嘞...(很棒,成功折腾我大半天时间) 翻翻github下的issue:github.com/GoogleChrom…
根据博主“强大的英语功底”: 大致问题应该是Chromium版本和puppeteer版本不兼容。那怎么办呢...降版呗 我直接锁定了版本号 cnpm install --save puppeteer@1.14.0
再次佛性编程... node XXX.js 你会发现你的PDF目录里...随着log的一行行出现,pdf一份份被打印出来~~~
总结
demo比较简洁,仅仅只是个爬虫的入门教程。各位大佬们可以根据demo,做进一步扩展。