大纲:站点 转化 为PDF文档

108 阅读1分钟

背景

文档中心需要将现有 web 内容转化为 PDF 文档 供用户下载。 如:

  1. docs.rongcloud.cn/android-iml…
  2. docs.rongcloud.cn/ios-imlib
  3. docs.rongcloud.cn/harmonyOS-i…

一个模块下有很多页面,需要将这些页面合并到一个PDF文件中输出。

技术方案

输出目录树

juejin.cn/spost/74500…

  1. 收集目录产出 目录树文件。

处理文档将内容输出到一个HTML文件中

juejin.cn/spost/74500…

  1. 按目录树收集 HTML 文件。
  2. 按目录树处理 文档内的 H1 - H5 的内容。
  3. 处理 HTML 输出到 output.html中, 删除头尾部分。

将 HTML 转化为 PDF

juejin.cn/spost/74500…

  1. 将合并后的 HTML 转化为 PDF 文档。
  2. 为 PDF 添加封面
  3. 为 PDF 添加目录
  4. 为 PDF 添加页码