使用AI+PdgCntEditor快速为PDF电子书添加目录

233 阅读4分钟

好不容易找到了需要的电子书,但望着空空的书签页,手动补齐目录可是一件苦差事。但是如今AI这么强大了,我们只需要借助AI识别出目录内容,再通过PdgCntEditor工具把目录写进PDF,原本需要半小时的工作,现在只需要几分钟就可以完成了!

使用AI识别目录文本

需要AI做什么

  1. 从目录图片中提取出“序号 标题 页码”这种格式的内容。原因将在下一节介绍。

  2. 计算正文第一页对应PDF的绝对页码和实际页码的差值,告诉AI让其在原有目录页码上增加这个偏移,从而能让书签能够跳转到对应页面上。

    image.png

操作步骤

将目录页以图片形式提取出来,作为附件喂给支持图文识别的AI,这里以豆包为例。另一方面,确认正文第1页对应绝对页码第17页,也就是需要将页码偏移16页。使用类似下面的提示词,让AI提取目录内容。

 附件图片是一本书的目录,请帮我按照“序号 标题 页码”的格式,解析出目录内容。
 ## 注意:
 1. 序号以目录中的为准,如果目录中没有序号,不要添加序号。
 2. 将所有页码依次加上16,例如第1页应输出第17页。
 ## 示例:
 1 引言 1
 1.1 脑机接口:电路与系统 2

image.png

使用PdgCntEditor写入目录书签

PdgCntEditor是一款PDF目录编辑工具,你可以很容易地从网上找到该程序。

按钮很多,但我们只需要了解这5个按钮和目录编辑区即可。

image.png

目录格式

如第一节所述,目录的格式为“序号 标题 页码”。

  • 序号:可以是第一章,1之类,而小节可以是1.1,1.3.2这种。序号不是必须的,当目录中包含序号时,可使用【自动分层】(选定区域自动缩进)功能,自动识别出目录层级,此目录最终将会以树形显示在书签里。
  • 标题
  • 页码:要跳转的页面页码。

操作步骤

  1. 打开PDF文件,可以直接拖曳进程序打开

  2. 将AI生成的目录直接粘进去,对于缺失的页码需手动补全。也可按需删掉。

    image.png

  3. 全选,点击【自动分层】,此时将根据序号自动调整缩进。此时缩进即为最终书签中的树形嵌套结构。

    image.png

    有些章节可能识别的不准确,还需手动调整,对需要缩进到下一级的,在该行左边按Tab键添加缩进。

    image.png

    image.png

  4. 再次全选文本,按【提取页码】(自动切分页码)。此时页码和标题将会分离,并间隔一个TAB的宽度。

    image.png

  5. 点击保存。目录即可写入PDF中。保存时PDF文件不能被任何其他程序打开,否则会保存失败。

    image.png

其它技巧

不对目录页码偏移

如果只需要正文中的目录,也可以不在一开始让AI对页码做偏移(即第1页还是对应绝对页码第1页)。只需点击【设置页码偏移】(PDF选项)。在其中修改基准页为正文第1页的绝对页码即可。

image.png

书签跳转时不改变缩放比率

有的PDF在点击标签页跳转后,会强行改变当前的缩放比例,这是因为书签动作是由2个属性构成的。一个是页码,另一个是缩放比率。而缩放比率又会根据创建书签时的缩放比率指定(适应页面、自定义等)。

image.png

虽然在PDF工具中无法改变该默认值或统一修改。但只需要使用PdgCntEditor打开该PDF,点击【设置页码偏移】(PDF选项)。确认点击目录后页面缩放为【承前缩放】,点击确定并保存即可。此时所有的书签的缩放比率都会变成【承前缩放】,也就是跳转后不会改变当前的缩放比率。

image.png