腾讯国际大赛再“亮剑”,腾讯云打开OCR技术场景应用新时代

253 阅读6分钟
原文链接: cloud.tencent.com

11月9日,具有OCR领域的奥斯卡盛会之称的“第14届国际文档分析与识别大会(ICDAR)”,揭晓了2017 ICDAR竞赛结果。腾讯数平精准推荐团队首次出征便凭借自研的“时空上下文感知的OCR深度学习算法” 斩获四项冠军。


(ICDAR2017获奖证书)

OCR技术落地,给予全新解决方案

国际文档分析与识别大会(ICDAR)专注于文本领域的识别与应用,自2003年大会设立“Robust Reading Competitions”以来,该竞赛就成了评测和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最为重要的国际赛事及标准,竞赛中的诸多方法对OCR技术的发展具有强大推动力。高技术难度、强大实际应用性,也使该盛会受到科研院校、科技公司等的关注,至今已有89个国家的3500多支队伍参与。


(参赛队伍数量统计)

据了解,首次参与竞逐的腾讯数平精准推荐团队在文本识别领域上已深耕多年,自研的基于深度学习方法的文本检测与识别技术在往届ICDAR竞赛数据集上也曾多次刷新世界纪录。相关技术在腾讯内部多款产品成功应用,特别在广告推荐的场景中,通过OCR 技术深度识别和理解广告素材创意,大幅提升了用户点击率预估的效果。

腾讯优图OCR技术也早在ICDAR 2015大赛的场景文字识别和自然场景文本检测两项目中取得第一,并且,基于腾讯优图实验室的业界领先的核心能力,腾讯云将OCR文本识别和检测技术真正落地,深度介入印刷体和手写体存在的各种场景,给予行业流程繁琐、效率低下以及成本居高不下的全新解决方案。

智能解放生产力,助力行业标杆

OCR是人工智能里面非常重要的基础能力之一,对于传统行业,在优化业务流程、解放生产力和降低企业成本方面,实效凸显。而受众群体极广、业务量相对较大、频次较高的物流场景对这一技术的追求,显得迫切,纷纷通过腾讯云依托优图实验室的OCR技术给予的全新解决方案成就行业标杆。

物流行业劳动密集型的属性,在顺丰身上比较明显。据悉,目前顺丰拥有将近20万地面小哥,平均每天传递将近900万个包裹和商务信件,这在以前需要顺丰雇佣大量输单员手动输入运单信息。和腾讯云战略合作之后,凭借其OCR技术全新解决方案,实现快速识别手写体和打印体的快递单,准确率高达91%。以往因容易认错而加大物流中的人力、物力和时间成本的潦草的手写寄件收件信息,也能够识别,正确率接近人工识别水平。最终,加上本身OCR技术的“7X24”服务能力,给予顺丰3小时内识别2000万张订单信息的业务效率,一定程度上也极大的提高了整体物流效率,而且不经人工,也一定程度上降低了用户隐私泄露的风险。

腾讯云与中国外运合作,依托优图实验室识别技术帮助解决企业效率问题,也是一个典型的智能实践案例。中外运是国际整合物流服务商,海外网络覆盖全球五大洲,其每年业务系统订单超过300万,而在传统作业方式下,人工识别、录入一笔单据需要3分钟。而通过应用OCR技术解决方案,识别单据仅需4秒,而且实现识别即入系统,效率提升45倍。据了解,除了单据录入,中外运在订舱委托、订舱确认件、提单样本、发票等环节都应用了这一技术,传统人力操作业务流程彻底变成自动化智能化,降低企业负担。

强大技术能力,支撑多场景应用环境

除了物流行业场景的天然需求,腾讯云依托优图实验室OCR技术给予的解决方案,还被广泛应用在金融、保险以及政府部门等行业组织场景中的证件识别,如身份证、驾驶证、行驶证、营业执照、车牌、名片等。据了解,该解决方案已支持英文数字识别,和超过9000个常用汉字的简繁体识别。针对身份证识别,其已支持身份证的正、反面识别,一次扫描即可识别所有字段,对于像倾斜、暗光、曝光、阴影等异常场景环境的识别,也能保障准确率。该解决方案还能通过自适应判别纠正技术,将身份证上的数字识别准确率提高到99.9%以上,而对印刷体名片,其能自动识别和定位姓名、手机号、QQ等字段,并实现30度以内的角度偏转,姓名字段与手机号码字段的自动识别准确率超过90%,领跑业界。

值得一提的是,传统的营业执照信息录入,要依赖人工对信息进行录入、处理和核对,存在信息录入错误、效率低等问题。上传营业执照便能自动识别名称、执照号等,支持核实与纠正识别的信息。避免繁琐的人工输入,同时又能提高注册和客服审核的效率与准确度。对营业执照存在的不同版本的字段分布差异以及执照图片质量差等问题,其定制研发的OCR检测识别引擎,识别准确率达到95%以上。

腾讯云打造的多场景智能识别解决方案,其本身不断优化升级的同时,还携手更多行业合作伙伴,通过技术赋能实现行业改革,提升整体行业效率,最终也将受惠于每一个人。