刚刚群里面分享了纸质版的樊登故事会, 都 2021 年了我觉得看纸质太麻烦了, 网上应该有应该有一堆 pdf 打包的合集, 下载下来岂不美哉. 一顿搜索之后发现都是单个 pdf , 这个云盘那个网盘这个码那个码的, 一个个下载太慢了, 之后再搜索后来这笔原来抖音 7100w 的粉丝, 转念一想应该有人做过类似的公众号合集, 一搜还真有, 分析之后发现接口是透明的, 直接返回 pdf, 但是一本完整的书 pdf 都是 n 个 pdf 整在一起的, 之后肯定需要合并起来成为一个完整的, 先不管3721, 直接爬虫全部下载下来. 如下.
合并的时候直接谷歌搜索 nodejs pdf merge
我先找到了一个 www.npmjs.com/package/eas…
一看这下载量堪比某老师的作品, 这 api 如此接地气, 这调用他妈的如此简单. 我呼吸变得有点急促, 嗯, 确定过眼神. 你就是我要找的人.
cnpm i 娶她进门, 复制粘贴, 一气呵成, 遍历文件, pdf 生成, 理因如是.
node xxx 一顿操作, 出来个图形界面针不错, 沃曹磊, Super surprise. 这简直是喜当爹, 我突然觉得头上多了一顶某种颜色的帽子.
很显然这并不是我一个人的错. 感情这东西是双向的, 单方面无条件的付出是不行滴.
但我又不想马上离婚, 因为我已经付出了感情, 把她从我生命里删除不是一件容易的事情.
我觉得是时候跟她坐下来好好聊聊了, 一看源代码,
let command = [
"java", "-jar", jarPath, "PDFMerger"
];
let maxHeapOpt = opts.maxHeap ? '-Xmx' + opts.maxHeap : null
if (maxHeapOpt) {
command.splice(2, 0, maxHeapOpt)
}
exec(command.join(' '), opts
子进程调用 java, 哎, 为何偏偏是 java !!!!
人是不能始乱终弃的, 更何况是我这样的人. 所以只能换个老婆了.
天涯何处无芳草, 更何况我有 npm 这个青青草原呢.
一顿搜索又找到一个备胎, www.npmjs.com/package/nod…
一看 api, 函数调用, 这下载量, 嗯, 怎么说呢, 有种初恋的味道. 确定过眼神, 你就是对的人.
当然, 无数先贤告诫我们, 人不能在一个地方跌倒两次, 当一个人用一段情换来一身伤痕的时候, 以后就不会那么奋不顾身.
所以慢慢的我们会变得越来越谨慎, 保守, 变得不那么傻.
所以当我再次 node xxx,
嗯, 我 TM 就知道, 她肯定存在我所不知道的姿势.
进入正经模式.
这个库用到 pdftk, linux 系统下面可以用 sudo apt-get install pdftk
macos 下面可以用
brew tap spl/pdftk
brew install pdftk
之后运行还是不对, 又发现了一些细小的说明, 原来是版本不对
Update 2 (2016-01-12): For OS X 10.11 El Capitan users, the source build ofpdftkdoes not seem to work. There is a.pkgavailable athttps://stackoverflow.com/a/33248310/545794. As of this date, PDF Labs has not yet released a source update that fixes the build.
stackoverflow.com/questions/2… 安装 pkg 包
运行
❯ node foo.js
收工