在企业数字化转型过程中,文档处理效率直接影响业务流转速度。面对堆积如山的PDF扫描件、复杂表格及手写批注,传统OCR工具往往力不从心。合合信息旗下的TextIn智能文档处理云平台,基于超过16年的OCR技术积累,提供了一套针对复杂文档的通用解析方案。
TextIn的核心技术优势
与基础OCR工具不同,TextIn定位为“大模型友好的通用文档解析平台”。其技术架构采用分层设计,涵盖底层数据基建、算法层元素解析、应用层版面还原以及接入层分发。
在实际性能测试中,TextIn处理100页长文档的解析时间可控制在2秒左右。这一速度对于金融行业财报季的海量数据录入至关重要,能够满足T+0完成数据库更新的时效要求。
TextIn的版面分析能力支持复杂场景处理。无论是跨页表格、合并单元格还是无线表格,均能精准解析结构。对于文档中常见的手写签名、批注及印章覆盖,系统能有效分离背景干扰,清晰辨识被覆盖的文字,确保关键信息的完整提取。
API接口调用实战:MaxKB集成方案
合合信息TextIn与MaxKB开源智能体平台的结合,为PDF扫描件审核提供了完整的技术路径。整体流程遵循“文件上传→工具提取→大模型审核”的实现逻辑。
第一步:获取认证凭证
使用前需注册TextIn智能文档处理云平台,获取x-ti-app-id和x-ti-secret-code两个核心认证参数。
第二步:生成PDF下载链接
在MaxKB高级编排中启用文件上传功能,系统会在{{开始.document}}参数中存储文档URL。通过编写函数工具解析该参数,按照:<端口号>/admin/application/格式输出下载链接。
第三步:调用TextIn接口转换文档
核心函数通过调用TextIn的OCR服务,将PDF扫描件转换为Markdown格式文本。该步骤会创建临时文件保存PDF,调用API接口完成格式转换并返回结果。
第四步:大模型执行审核逻辑
将提取的文档信息与用户需求结合,由AI执行文档审核逻辑,生成最终的审核结果或回答。
多元应用场景覆盖
TextIn的应用范围广泛。在身份认证场景,其身份证识别功能可对正反面全部字段进行结构化识别,身份证号码和姓名识别准确率处于行业领先水平。在金融领域,TextIn文档解析覆盖金融报告、招投标文件、合同等各类常见文档。
值得一提的是,TextIn近期上线的“图表解析”功能,能够将柱状图、折线图等图表转化为结构化数据,解决了金融研报和学术论文中图表难以被大模型读懂的痛点。
合合信息TextIn提供公有云API和私有化部署两种接入方式,企业可根据数据安全需求灵活选择。对于初次使用的开发者,平台提供免费试用额度,降低技术验证门槛。