OCR识别API接口调用在企业数字化转型过程中，文档处理效率直接影响业务流转速度。面对堆积如山的PDF扫描件、复杂表格及

在企业数字化转型过程中，文档处理效率直接影响业务流转速度。面对堆积如山的PDF扫描件、复杂表格及手写批注，传统OCR工具往往力不从心。合合信息旗下的TextIn智能文档处理云平台，基于超过16年的OCR技术积累，提供了一套针对复杂文档的通用解析方案。

TextIn的核心技术优势

与基础OCR工具不同，TextIn定位为“大模型友好的通用文档解析平台”。其技术架构采用分层设计，涵盖底层数据基建、算法层元素解析、应用层版面还原以及接入层分发。

在实际性能测试中，TextIn处理100页长文档的解析时间可控制在2秒左右。这一速度对于金融行业财报季的海量数据录入至关重要，能够满足T+0完成数据库更新的时效要求。

TextIn的版面分析能力支持复杂场景处理。无论是跨页表格、合并单元格还是无线表格，均能精准解析结构。对于文档中常见的手写签名、批注及印章覆盖，系统能有效分离背景干扰，清晰辨识被覆盖的文字，确保关键信息的完整提取。

合合信息TextIn与MaxKB开源智能体平台的结合，为PDF扫描件审核提供了完整的技术路径。整体流程遵循“文件上传→工具提取→大模型审核”的实现逻辑。

第一步：获取认证凭证

使用前需注册TextIn智能文档处理云平台，获取x-ti-app-id和x-ti-secret-code两个核心认证参数。

第二步：生成PDF下载链接

在MaxKB高级编排中启用文件上传功能，系统会在{{开始.document}}参数中存储文档URL。通过编写函数工具解析该参数，按照:<端口号>/admin/application/格式输出下载链接。

第三步：调用TextIn接口转换文档

核心函数通过调用TextIn的OCR服务，将PDF扫描件转换为Markdown格式文本。该步骤会创建临时文件保存PDF，调用API接口完成格式转换并返回结果。

第四步：大模型执行审核逻辑

将提取的文档信息与用户需求结合，由AI执行文档审核逻辑，生成最终的审核结果或回答。

TextIn的应用范围广泛。在身份认证场景，其身份证识别功能可对正反面全部字段进行结构化识别，身份证号码和姓名识别准确率处于行业领先水平。在金融领域，TextIn文档解析覆盖金融报告、招投标文件、合同等各类常见文档。

值得一提的是，TextIn近期上线的“图表解析”功能，能够将柱状图、折线图等图表转化为结构化数据，解决了金融研报和学术论文中图表难以被大模型读懂的痛点。

合合信息TextIn提供公有云API和私有化部署两种接入方式，企业可根据数据安全需求灵活选择。对于初次使用的开发者，平台提供免费试用额度，降低技术验证门槛。