先讲个真实到扎心的段子:某制造业CIO在年度复盘时自嘲,公司上数据治理项目比换ERP还勤,每次验收都像新婚燕尔,两年后再回头看,数据照样乱成前任——业务部门骂数据不准,数据部门怪业务乱填,IT夹在中间两头受气。这场景,熟悉不?
最近,一家平时在圈里不太爱开发布会的国产软件厂商“中翰软件”,突然甩出了一套方案,主打“AI原生”和“本体论”。一开始我寻思又是哪家厂商在给老产品贴金,但翻了他们的技术白皮书和几个落地案例后,说实话,有几个思路确实挠到痒处了。
治了十几年,钱花哪去了?
先别急着聊方案,得先搞清楚病根儿在哪。中翰在材料里总结了五个痛点,我觉着总结得挺损,但也确实到位:
一是工具太“直男”。传统治理界面全是给DBA看的,表空间、分区、ETL脚本。业务老大想拉个“华东区逾期订单”报表,得先学会区分哪个字段叫“逾期”、哪个视图代表“华东”,这门槛比招个数据分析师还高。
二是“两张皮”现象。治理团队拿着99.9%的数据质量报告交差,经营分析会上一对账,财务和销售各说各话,窟窿一大堆。业务人员只知道数据不准,但根本定位不到是哪个环节在哪个时间点出了岔子。
三是永远在救火。流程设计时没预防,全靠运维当“消防员”。等发现编码撞车、重复录入时,脏数据早顺着ETL管道流到各个报表里了,清理代价极高。
四是“人走茶凉”。主数据平台上线风风光光,第三年去看,数据质量稀烂。实施顾问撤了,文档厚得像砖头,内部团队只会按按钮,业务一变化就抓瞎。
五是“外援依赖症”。项目交付不是知识转移,而是交接一本操作手册。新业务冒出来,甲方自己不会调优,只能再花几百万请人回来“返场”。
本体论:给企业数据建一本“新华字典”
这次中翰方案里最核心的概念,叫“本体论”。别被这哲学味儿的词唬住,落地到业务上,它就是给企业建一套全公司通用的“业务概念词典”。
举个例子,销售系统的客户叫CUST_ID,客服系统叫CLIENT_CODE,财务叫CUSTOMER_NO。以前做映射全靠实施顾问写对照表,业务一变就崩。中翰的做法是:先把这个“客户”实体到底包含哪些属性(名称、统一信用代码、行业、信用等级……),以及客户和订单、合同、回款之间到底啥关系,统统用本体模型定义死。
这套“词典”建好后,底层不管你是Oracle、MySQL还是国产数据库,字段叫ABC还是XYZ,全给你映射到统一语义层。业务人员查数据,直接搜“华东区大客户的逾期订单”,系统自动翻译成底层查询语言。
更进阶的是,这套模型让数据有了点“推理能力”。系统知道某客户信用等级下调+该客户有3笔在途订单+物流状态均为“已发货”,就能主动给风控推个预警。这从“你问我答”变成“我主动提醒”,才是AI该干的事儿。
终于有人对PDF和监控视频“下手”了
另一个让我觉得有点意思的,是他们这次对非结构化数据的治理力度。
都知道企业里80%的数据是文档、图片、音频、视频,但传统治理平台基本选择性失明——只管数据库里那几张二维表。中翰这次把OCR识别、语音转写、图像标注这些AI能力直接集成进管道,PDF合同、客服录音、监控画面、设备传感器流数据,统统拉进来治理。
背后逻辑很直接:把这些非结构化数据变成可检索、可分析、可关联的知识资产。比如从100万份设备维修记录PDF里,自动提取故障模式、维修时长、备件消耗,再和结构化设备台账关联,形成设备健康知识图谱——这个场景,干过设备运维的都懂含金量。
多智能体协作:让AI当数据治理“实习生军团”
这次中翰最不像传统厂商的地方,是他们把“多智能体协作”做成了核心交互方式。
别被“智能体”唬住,就理解成一群各有专长的AI数字员工:数据探查员自动扫描新数据源、识别字段含义、检测异常;清洗工自动去重补全标准化;业务探查员跟业务对话,理解“有效订单”到底怎么定义;资源盘点员定期盘资产、标热度;体系迭代员在业务变更时自动建议模型调整。
重点在于,这些智能体支持自然语言交互。业务主管想合并两个客商库,不用提工单等IT排期,直接在对话框里说“帮我合并A库和B库,优先采用最近更新日期较新的记录”,智能体就自动干活了。
这相当于把操作门槛从“专家级”降到了“办公软件级”。业务主导这事儿,终于不再只是一句口号。
交付模式也换了:从“甩手走人”到“十二周带练”
最后聊两句实施。中翰这次推了个“双轨带练”模式,说白了就是线上AI顾问7×24小时陪跑+实体顾问关键节点介入。
传统实施是顾问写方案、开发写代码、甲方看着干,结束交钥匙。中翰反过来——十二周内,乙方是教练,甲方团队是实操主力。从治理规划到标准迭代,每个核心能力都通过实战传递。线上AI顾问随时解答“这个映射怎么配”“那个清洗逻辑对不对”,实体顾问只在堵点时进场。
他们还内置了离散制造、化工、医药、零售、能源等行业的标准数据模型,企业不用从零开始建词典。据称能省80%前期咨询时间——数字我打个折扣,但方向是对的:让实施周期从“年”缩到“月”。
说点实在的
数据治理这赛道太容易出PPT产品了。但中翰这次发布,有几个点让人觉得是认真做了功课的:他们没回避“治而不愈”的行业伤疤;把本体论和AI智能体、非结构化治理揉成了可交付产品,国内厂商里不多见;交付模式上的“去依赖化”设计,说明对自家产品的可维护性有底气——不怕客户学会,就怕客户学不会。
当然,挑战也很现实。本体初始构建仍需业务专家深度参与,AI目前还不能完全替代;多智能体在复杂业务场景下的推理准确率,还需更多案例验证;对于数据治理成熟度极低的企业,是否真能跳过“建标准、立规范”的苦功夫,直接进入智能治理——我持保留态度。
但至少,中翰这次指了个明确的方向:数据治理的未来,不该是DBA和咨询顾问的专利,而该成为业务人员随手可用的能力。如果这套方案真能让从业者从“年年治理年年乱”里解脱出来,那这个发布,值得行业多看一眼。