现在很多企业都在讲“我们要做数据治理”“我们要规范数据资产”。
听起来都挺高大上,但你真问他:
“你们现在做了哪些?”
有的说:“我们准备上个数据平台。” 有的说:“我们打算先建指标体系。” 还有的说:“我们请了顾问在做元数据治理。”
听着都不算错,但说实话,真能落下来的,没几家。
为什么?
因为大多数企业一上来就想搞“全局方案”“统一平台”“全口径标准化”,想一步到位,结果搞得太复杂、太抽象,部门不配合,系统跟不上,最后不了了之。
你要问我,数据治理第一步到底该怎么搞?我的回答很简单:
先把三张表做出来:指标目录、数据字典、数据责任表。
别看就三张表,真落地起来,绝对比做一堆PPT管用得多。
先说说“为什么非得从这三张表开始?”
咱们就从最常见的一句话说起:“这数据对不对?”
听起来简单,但你想回答这个问题,其实要解决三个更底层的东西:
- **这数据是什么?**——字段什么意思、值代表啥
- **怎么算出来的?**——口径是什么、来源从哪来
- **出了问题找谁?**——谁负责维护、谁拍板定标准
说白了,就是三个事:
看得懂、算得清、找得到人。
这三件事,正好就对应我们这三张表:
- 数据字典 → 字段看得懂
- 指标目录 → 指标算得清
- 数据责任表 → 问题找得到人
你搞清这三样,哪怕没系统、没平台、没预算,数据治理也能往前推一大步。
第一张表:指标目录 —— 统一口径的第一步
什么叫指标目录?
说白了,就是把企业最常用的指标,比如销售额、订单数、毛利率、库存周转、复购率这些——一个个拎出来说明白:这个指标怎么算?字段取自哪?频率是多少?能在哪里看到?谁负责?
很多企业的问题就在这儿:
- 指标很多,但没有统一定义
- 每个部门都有自己的口径,互不兼容
- 指标的计算逻辑藏在某个人的Excel公式里,谁走了谁也搞不清
所以建议你干一件事: 把公司常用的指标拉个清单,逐个梳理清楚定义、公式、来源、负责人。
不求一次做全,从TOP20常用指标做起就行。 别想着一步到位,能用起来才是关键。
第二张表:数据字典 —— 把字段写成“人话”
第二个问题,是“看不懂字段”。
有一次我去一家零售企业,BI看板上有个字段叫 order_type,页面解释说:“订单类型=1是线上,2是线下”。我一看,还挺标准。
结果运营同事说:“我们后台系统里是0代表正常订单,1是促销订单,2是特殊渠道订单,和BI里的完全不是一回事。”
然后你一查数据库,发现 order_type=3 的也不少,没人知道是啥。
这就是典型的——字段多、系统杂、没人写说明、业务看不懂。
所以必须要搞一份数据字典:
什么字段在哪张表?叫什么?代表什么?有哪几种取值?什么场景下用?
写得不需要很官方,但要让业务能看得懂,别整技术黑话。 比如不要写“varchar(255)”这类字段类型,而是写“商品编码,用于唯一标识SKU”。
字段说明写清楚,比你搞五张ER图都强。
这份表将来可以贴在BI平台、数据门户或者知识库里,让谁看都能明白。
第三张表:数据责任表 —— 出问题,找谁说理?
这是企业最容易忽略,但出事概率最高的一张表。
当报表错了、字段不对、指标跳了,大家都会说一句话:
“不是我搞的。”
结果没人认,没人改,事情就搁那儿了。
为什么?因为没人负责。
所以,**必须有一个“数据责任表”**,明确一件事:
- 这张报表谁管?
- 这个指标谁拍板?
- 这个字段出错找谁?
- 这个表结构谁维护?
- 这个BI面板谁更新?
你可以不用很系统化的工具,先搞一个共享Excel表,列清楚:
- 报表名称 / 指标名称 / 字段名称
- 负责人(名字+部门)
- 维护内容 / 更新频率 / 联系方式
目的只有一个:
别让数据变成“没人认领的孤儿”。
那怎么一步步把这三张表落地?
说到底,企业不是做不了这三张表,是不知道怎么开始,或者一开始就想得太复杂,反而动不了手。
其实你真想干,四步走就够了:
第一步:别想着做全,先找重点下手
最怕一开始就想着“一次把所有指标梳理完、全系统字段都建字典、全员都配上责任人”。
听起来很有魄力,结果就是谁也落不下去,最后不了了之。
建议你从最现实的地方入手:
从老板最常看的报表开始
比如你现在BI里有10张报表,其中3张是老板每周盯的,那就从这3张报表拆:
- 把用到的指标一个个列出来,弄清楚怎么定义的、怎么算的、来源是啥;
- 把页面上看到的字段拎出来,搞清楚这些字段是不是业务能理解的,能不能写出人话说明;
- 再问这张报表是哪个部门在看,谁最常提问题,谁维护口径,谁更新逻辑,把责任人先配上。
别管别的,就先把“老板用的看板”搞清楚。
或者从一个高频业务场景入手
比如“销售日报”“库存预警看板”“会员运营分析”这类一线用得多的。
你可以选一个业务场景,把它当作切入点来练手:
- 先理清楚业务人员最常提的指标是哪些;
- 每个字段怎么填的,谁给的数据,有没有异常值、取值范围;
- 再顺着分析链条去看,数据从哪来,哪些表、哪些字段参与了。
这样做的好处是:你做完这一个场景,后面就有“可复制的经验模板”了,照着套就行。
第二步:拉业务一起干,别闭门造表
这一步是最容易忽略,也最关键的一个点。
很多数据团队习惯自己做事,觉得业务不专业,干脆数据表我们自己做完给他们看就行了。但结果往往是:
- 字段写得再标准,业务说:“这我看不懂。”
- 指标定义再严谨,业务说:“不是这么算的。”
- 责任人你配好了,对方说:“这事我没认过。”
所以你要做的不是闭门写表,而是**拉业务一起“对口径、补字段、认责任”**。
你可以一对一,也可以开个小会,围绕几个核心问题来聊:
- “你们平时说GMV,到底是哪个金额字段?”
- “我们BI里这个字段,是不是你们系统里那个叫order_type的?”
- “这张报表你们最常看哪里?哪些是你们日常要解释的数据?”
- “这份报表出了错,你们一般是找谁确认的?”
有时候你问这几个问题,业务自己都意识到:“哦,原来我们叫的名字和你们理解的不一样。”
一边问一边写,一起对完,再请业务签字确认。 这个确认过程本身就是“治理”。
第三步:先用表格搞起来,再慢慢系统化
你可能会问:“这三张表有没有系统可以做?”当然有。
但我建议你,一开始先别上系统。
为啥?因为你还没走通流程,流程都没跑通,系统只能给你带来“操作负担”。
你需要的,是一份能随手填、随时改、大家都能访问的表格
比起“用什么工具”,更重要的是“谁来填”“怎么维护”“大家用不用”。
你先把这三张表在团队内部跑起来,等大家习惯了、有节奏了,再考虑用系统平台来“接管流程”。
千万别反过来,别一上来就去选平台,治理不是靠系统,是靠人和流程。
第四步:定一个更新机制,别搞“一次性工程”
这三张表最容易的问题不是做不出来,而是:做完一次,就再也没人动了。
指标口径一变没人更新,字段增加了没人加字典,新同事来了不知道责任人是谁,最终这三张表又变成“摆设”。
怎么解决?很简单,定节奏。
每月一次,检查指标口径有没有变化
特别是一些指标如果涉及活动、规则变动,一定要及时同步。
你可以设个“指标review日”,10分钟快速过一下。
每季度一次,更新数据字典
系统可能新接了几张表、字段改了名、数据类型换了,你定期扫一遍,补上字段说明,别等出错了才补。
每半年一次,拉业务一起来“责任人对表”
人换了岗、组织换结构、BI报表做了大调整,责任人也要跟着改。
建议你搞个“数据负责人清单”,半年一次拉业务来确认,谁还在岗,谁是新的对口人。
你要是想稳一点,也可以在每份BI报表里加一个角标:“责任人:张三,部门:运营部,联系电话:XXXX”,这样出了问题,业务也知道找谁。
最后建议你把这事写进数据团队的月度或季度工作计划,不然真的会被“日常琐事”冲没。
总结一遍这四步,不绕圈,干货就这几条:
- 别做全,选重点开始:从老板看得最多的看板、业务用得最频的场景入手
- 拉上业务一起干:指标怎么叫、字段怎么用、谁说了算,不是你一个人能拍板的
- 别急着上系统:先把表格跑通,跑顺了再考虑系统化
- 设好更新机制:数据口径在变,人在换,三张表必须动态维护
这四步做下来,你这三张表基本能落地,而且不是“孤零零躺在知识库里的表”,是真正“用得起来”的治理工具。
后面再往系统化、流程化去发展,那就水到渠成了。