引言

说到es6，一帮前端大佬可能会跳出来说："es6真是太优雅了，解构赋值、正则表达式的扩展、Symbol Map Set等数据类型、Class语法糖、Promise、aysnc等等等等...."，说了这么多，请问这些资料是哪里看来的呢，没猜错的话，基本都是从"阮一峰大神的ECMAScript 6 入门"获取的知识。那么，如果我想把在线文档变成本地的PDF该怎么办呢。。。这就用到伟大的爬虫技术啦。

话不多说，先贴我们用到的node的一个爬虫模块"puppeteer"：github.com/GoogleChrom…

开工

cnpm install --save puppeteer // 一看package.json依赖包，puppeteer： ^1.19.0，没错最新版本。这时候你是不是很开心，爬虫模块装好了。

接下来直接贴代码吧（注释还是比较详细的）

（哈哈，别问我为什么截图，不贴代码）

在你当前项目目录下， node XXX.js 回车一按。。。妈耶怎么有个error。

error详情如下：(node:7780) UnhandledPromiseRejectionWarning: Error: Protocol error (IO.read): I nvalid parameters handle: string value expected

各种log，各种debugger，似乎仍然找不到解决方案。那怎么办嘞...（很棒，成功折腾我大半天时间）翻翻github下的issue：github.com/GoogleChrom…

根据博主“强大的英语功底”：大致问题应该是Chromium版本和puppeteer版本不兼容。那怎么办呢...降版呗我直接锁定了版本号 cnpm install --save puppeteer@1.14.0

再次佛性编程... node XXX.js 你会发现你的PDF目录里...随着log的一行行出现，pdf一份份被打印出来~~~

总结

demo比较简洁，仅仅只是个爬虫的入门教程。各位大佬们可以根据demo，做进一步扩展。

手把手教你用node爬虫爬下阮大神的“es6从入门到放弃”

引言

开工

总结