好不容易找到了需要的电子书,但望着空空的书签页,手动补齐目录可是一件苦差事。但是如今AI这么强大了,我们只需要借助AI识别出目录内容,再通过PdgCntEditor工具把目录写进PDF,原本需要半小时的工作,现在只需要几分钟就可以完成了!
使用AI识别目录文本
需要AI做什么
-
从目录图片中提取出“序号 标题 页码”这种格式的内容。原因将在下一节介绍。
-
计算正文第一页对应PDF的绝对页码和实际页码的差值,告诉AI让其在原有目录页码上增加这个偏移,从而能让书签能够跳转到对应页面上。
操作步骤
将目录页以图片形式提取出来,作为附件喂给支持图文识别的AI,这里以豆包为例。另一方面,确认正文第1页对应绝对页码第17页,也就是需要将页码偏移16页。使用类似下面的提示词,让AI提取目录内容。
附件图片是一本书的目录,请帮我按照“序号 标题 页码”的格式,解析出目录内容。
## 注意:
1. 序号以目录中的为准,如果目录中没有序号,不要添加序号。
2. 将所有页码依次加上16,例如第1页应输出第17页。
## 示例:
1 引言 1
1.1 脑机接口:电路与系统 2
使用PdgCntEditor写入目录书签
PdgCntEditor是一款PDF目录编辑工具,你可以很容易地从网上找到该程序。
按钮很多,但我们只需要了解这5个按钮和目录编辑区即可。
目录格式
如第一节所述,目录的格式为“序号 标题 页码”。
- 序号:可以是第一章,1之类,而小节可以是1.1,1.3.2这种。序号不是必须的,当目录中包含序号时,可使用【自动分层】(选定区域自动缩进)功能,自动识别出目录层级,此目录最终将会以树形显示在书签里。
- 标题
- 页码:要跳转的页面页码。
操作步骤
-
打开PDF文件,可以直接拖曳进程序打开
-
将AI生成的目录直接粘进去,对于缺失的页码需手动补全。也可按需删掉。
-
全选,点击【自动分层】,此时将根据序号自动调整缩进。此时缩进即为最终书签中的树形嵌套结构。
有些章节可能识别的不准确,还需手动调整,对需要缩进到下一级的,在该行左边按Tab键添加缩进。
-
再次全选文本,按【提取页码】(自动切分页码)。此时页码和标题将会分离,并间隔一个TAB的宽度。
-
点击保存。目录即可写入PDF中。保存时PDF文件不能被任何其他程序打开,否则会保存失败。
其它技巧
不对目录页码偏移
如果只需要正文中的目录,也可以不在一开始让AI对页码做偏移(即第1页还是对应绝对页码第1页)。只需点击【设置页码偏移】(PDF选项)。在其中修改基准页为正文第1页的绝对页码即可。
书签跳转时不改变缩放比率
有的PDF在点击标签页跳转后,会强行改变当前的缩放比例,这是因为书签动作是由2个属性构成的。一个是页码,另一个是缩放比率。而缩放比率又会根据创建书签时的缩放比率指定(适应页面、自定义等)。
虽然在PDF工具中无法改变该默认值或统一修改。但只需要使用PdgCntEditor打开该PDF,点击【设置页码偏移】(PDF选项)。确认点击目录后页面缩放为【承前缩放】,点击确定并保存即可。此时所有的书签的缩放比率都会变成【承前缩放】,也就是跳转后不会改变当前的缩放比率。