一、一个真实的场景
上周三上午10点,某互联网公司的HRBP小雅给我发了一条微信:
“救命,今天入职5个人,每个人的学历证、身份证、上一家公司的离职证明都要核对、归档、录入系统。我刚弄完第2个,还有3个人在等。午饭肯定没戏了。”
这不是段子。
做过HR的人都懂:入职日 = 打仗日。
新员工坐在那里等,HR在系统里一个一个字段地敲。姓名、身份证号、手机号、紧急联系人、学历信息……一个档案少说20个字段。如果遇到身份证模糊、日期对不上、离职证明缺章,还要反复沟通。
小雅告诉我,平均每个人要花40-60分钟。5个人就是半天。
而她的痛苦还不止于此——录入完成后,还要把纸质材料扫描、重命名、上传到多个系统(HR系统、OA、钉钉/企微通讯录、社保系统……)。
“我感觉自己像个打字员,而不是HR。”
二、痛点拆解:为什么这么慢?
我把小雅的入职档案处理流程拆解了一下:
| 步骤 | 耗时 | 痛点 |
|---|---|---|
| 核对身份证信息 | 10分钟 | 姓名拼音、有效期、签发机关要逐字核对 |
| 录入学历信息 | 5分钟 | 学校名称、专业、学位类型、毕业时间 |
| 录入联系方式 | 3分钟 | 手机号、邮箱、紧急联系人 |
| 录入工作经历 | 5分钟 | 上一家公司、职位、起止时间 |
| 扫描+重命名 | 10分钟 | 每份文件要命名:姓名_身份证.jpg |
| 上传到多个系统 | 10-15分钟 | HR系统、OA、钉钉通讯录…… |
合计:43-58分钟/人
而最让人崩溃的是:这些工作几乎没有“增值”——核对身份证不会让员工更满意,录入系统不会让公司更高效,但HR的时间就这么被消耗掉了。
三、AI能做到什么?
后来我帮小雅做了一个测试:用AI处理入职档案。
操作方式很简单:
把新员工提交的材料(身份证照片、毕业证照片、离职证明照片)丢给AI,让它自动提取关键信息。
测试结果:
以一份身份证为例,AI在3秒内返回了:
同样的,毕业证:
离职证明:
全程不超过30秒。
四、真实对比:半天 vs 10分钟
我把AI处理的结果交给小雅,她只需要做两件事:
- 快速扫一眼,确认提取的信息没错
- 一键导出CSV,导入HR系统
新流程耗时:
| 步骤 | 耗时 |
|---|---|
| 拍照/扫描材料 | 2分钟 |
| AI自动提取(5份材料并行) | 30秒 |
| HR快速核对 | 3分钟 |
| 导出+导入系统 | 4分钟 |
| 合计 | 约10分钟/人 |
效率提升:80%以上。
小雅跟我说了句实话:“如果每天都能这样,我下午就可以做点真正有价值的事了——比如跟新员工聊聊职业规划,而不是对着身份证打字。”
五、背后的技术原理(简化版)
这个能力背后是多模态大模型的文档理解技术。简单说:
- OCR识别:把图片里的文字转成可编辑文本
- 字段提取:根据字段名(如“姓名”“身份证号”)自动定位并提取对应值
- 结构化输出:把散乱的信息整理成JSON或表格格式
目前市面上有现成的API可以直接调用。比如ZGI平台提供的入职档案自动解析能力,封装了上述流程,支持身份证、毕业证、学位证、离职证明等20+种常见证照的识别,开发者接入后可直接返回结构化数据,省去了自己训练模型的成本。
(如果你只需要快速解决这个问题,用现成的API比从零开发要高效得多。)
六、哪些HR场景可以复用?
同样的能力,不止入职档案能用:
| 场景 | 输入 | 输出 |
|---|---|---|
| 简历解析 | 简历PDF/图片 | 姓名、电话、工作经历、教育背景 |
| 考勤单识别 | 打卡截图 | 日期、时间、迟到/早退标记 |
| 报销单识别 | 发票照片 | 金额、开票日期、发票号 |
| 合同信息提取 | 合同扫描件 | 签约方、金额、签署日期 |
本质上都是:把图片/PDF里的关键信息,自动变成结构化数据。
七、写在最后
小雅后来跟我说:“我现在入职日不焦虑了。员工坐下填表的时候,我这边已经提取完了。他们签字的时候,我已经在导出了。”
AI不是来取代HR的。AI是来替HR做那些“像打字员一样的工作”,然后把时间还给HR去做“像人一样的工作”——沟通、关怀、规划、决策。
如果你也在被入职档案、简历录入、发票整理这些重复工作困扰,不妨试试AI。技术已经成熟了,落地成本也比想象中低很多。
本文提到的入职档案解析能力,ZGI平台提供了可直接调用的API,支持身份证、毕业证、离职证明等证照的自动识别与字段提取。感兴趣的朋友可以自行了解。