截至今年3月,我国日均词元(Token)调用量突破140万亿,比上年末增长超40%。我国人工智能商业化、规模化运营取得阶段性突破。
大模型调用量的井喷式增长,标志着AI正从“技术探索”全面迈入“业务落地”阶段。然而,企业级场景中超过80%的数据仍沉睡在非结构化的文档、单据、扫描件中——这些“脏数据”若不经过专业化处理,大模型即便有再强的推理能力也无从发挥。
在此基础上,信息抽取工具作为连接物理世界文档与数字世界认知能力的桥梁,正成为企业级AI解决方案中的核心基础设施。
本文将以银行国际结算这一典型高复杂度场景为例,深度解析一套成熟的企业级信息抽取解决方案。
1. 国际结算业务信息抽取的人力瓶颈
银行国际业务是现代金融体系中不可或缺的重要组成部分,涵盖了外汇交易、国际结算、贸易融资、跨境投资等领域。其中,国际结算业务是银行资产规模最大的核心业务,同时也是直接影响银行资产质量和经营安全性的关键业务。
在整个业务过程中,涉及大量的物流、资金流、信息流相关纸质单据。包括信用证、发票、合同、报关单、提单、装箱单、原产地证明、保单等数十种单据,且每种单据版式各异、质量参差。传统的人工审单模式效率低、易出错、人力成本高昂,成为制约业务发展的瓶颈。
2. 信息抽取工具企业级解决方案的设计
目前针对信息抽取,可选择的具备单点能力的工具不在少数,但在企业场景中,往往更需要衔接业务应用的上下游,即具备全链条能力。以合合信息旗下TextIn平台为例,一套专门为企业设计的、能够自动从大量非结构化或半结构化文档中提取关键字段并转化为结构化数据的系统,其核心能力包括:
● 文档识别:通过OCR技术将扫描件、图片等转化为可编辑的文字。
● 版面解析:理解文档的逻辑结构(标题、段落、表格、键值对等),定位关键信息所在位置。
● 语义理解:基于垂直领域语义模型,理解字段的业务含义(例如“INVOICE No.”和“发票号码”指向同一概念)。
● 结构化抽取:将识别出的关键信息按照预设字段进行提取和输出,如合同金额、日期、交易双方名称等。
诸如此类的企业级方案的核心价值在于, 解决人工处理文档效率低、易出错、成本高的痛点,同时满足金融等高监管行业对数据安全和合规性的严苛要求。区别于通用工具,企业级方案强调高精度、开箱即用(无需大量标注数据训练)、可私有化部署以及与业务系统的无缝对接。
3. 案例:合合信息TextIn平台的信息抽取能力与成效
还是以银行国际结算业务中的应用为例,展示TextIn平台的实际信息抽取效果。
业务单据类型方面,目前TextIn内置的常见模型类别包括但不限于:
● 信用证类:国内/国际开立信用证、信用证修改申请书、承兑通知书等
● 贸易单据类:INVOICE(发票)、交易合同、PO单、Packing List(装箱单)、海运提单、空运提单、原产地证明、保单等
● 报关类:进出口报关单等
● 汇款与申请类:境内汇款申请书、提款通知书、贷款变更通知书、购汇申请书、涉内外收入申报单等
典型字段抽取方面,内置的文档模型均已配置关键字段,上传后即可实现自动抽取:
● 开立信用证:申请日期、信用证号码、开证日期、申请人信息(英文名称、地址、电话)、通知银行、收货地、装货港
● INVOICE:发货单位、收货单位、发票编号、货物名称、数量、单价、总金额、日期、成交方式
● 交易合同:合同编号、交易双方名称、货物名称、单价、总金额、签署日期
● 进出口报关单:海关编号、合同协议号、提运单号、运输工具名称及航次号、境内/境外收发货人、监管方式、申报日期、商品名称及规格、数量及单位、单价、总价、币制、启运港、目的地等
● 海运提单:船公司、提单号、收货人、被通知人、船名/航次/船旗、装货港、卸货港、装船日
● Packing List:商品净重/毛重、买方、运输方式、总计
● 空运单:发货人、收货人、起运港、目的港、件数、毛重、运单号、运费支付方式等
● 提款通知书:申报号码、收款人名称、结算方式、收入款币种及金额、结汇汇率等
4. TextIn 企业级信息抽取解决方案的核心能力
区别于传统OCR+NLP方案,TextIn平台具备多项关键优势:
能力一:开箱即用的“零样本”抽取
● 传统痛点:传统方案依赖大量人工标注数据进行模型训练,一个单据类型可能需要标注数千份样本才能达到可用精度,调优周期长达数周甚至数月。
● 解决方案:合合信息依托自研的垂直领域语义模型,经过近百种场景、百万级数据的高质量语料训练,已具备强大的泛化能力。用户仅需配置相关抽取字段(告诉系统“我要抽什么”),无需提供标注样本,即可完成结构化抽取,实现真正的“开箱即用”。
能力二:覆盖多种非固定版式的复杂文档
● 传统痛点:国际结算单据版式千差万别——同一份“装箱单”在不同国家、不同公司的格式完全不同。传统基于固定模板的方案完全无法应对。
● 解决方案:智能文档抽取模型具备强大的迁移学习能力,能够理解文档的语义结构而非依赖固定位置。无论版式如何变化(表格形式、列表形式、段落形式),模型都能精准定位并提取目标字段。
能力三:支持多种复杂抽取类型
● 涵盖类型:
○ Key-Value对抽取:如“发票号:INV-2024-001”
○ 无Key的Value抽取:直接在文档特定位置出现的数值,无需标签
○ 表格内容还原及抽取:将复杂表格(多层表头、合并单元格)整体还原为结构化数据
○ 关系型抽取:抽取具有关联关系的多个字段(如“商品名称-数量-单价-金额”的组合)
能力四:基于抽取结果的智能审单
● 核心功能:抽取本身不是终点,真正的价值在于驱动业务决策。该方案直接对接行内业务系统,在业务审核界面实现:
○ 图文审核:将抽取出的文字与原始图像对应位置高亮显示,便于人工复核
○ 规则审核:自动校验业务规则,如“信用证号码是否唯一”“是否在有效期内”
○ 一致性审核:跨单据比对关键字段,如“信用证与境外汇款申请书的收款人与受益人名称是否一致”
● 人机交互:业务人员通过可视化审核页面进行快速复核、确认,兼顾自动化效率与人工兜底安全。
能力五:安全可控的企业级部署
● 数据安全:支持私有化部署,确保金融等高敏感行业的业务数据不出域。
● 系统对接:提供标准化的API接口,可无缝集成到银行现有的国际结算系统、信贷系统、风控系统中。
在大模型调用量井喷的今天,高质量的结构化数据输入,才是大模型发挥威力的前提。合合信息的智能文档抽取方案,正是为企业铺设了一条从“非结构化文档洪流”通往“智能化业务决策”的坚实道路。