数据标签和数据指标,不就是一回事吗?
这个问题是不是很熟悉?其实不光新手,我见过做了2年数据的同行,依然会混淆这两个概念。
今天我就结合这些年的实战经验,再参考行业内的常用知识,把数据标签和数据指标的区别、用法,还有一些容易忽略的细节, 一次性讲透。
一、什么是数据标签?
数据标签,本质是描述事物,更精准地说,是由标签名和标签值组成,贴在具体的目标对象上,让杂乱的原始数据变清晰、好区分。
用户、产品、渠道、营销活动,这些常见的业务对象都能打标签。
举个我工作中最常见的例子:
用户A,性别男,年龄28岁,所在城市北京,近30天登录过5次,从未消费过。这些用来描述用户A的信息,每一个都是数据标签。
这里有两个关键要点,你一定要记好。
1、标签是分类型的。
很多人只知道贴标签,却不知道标签有明确分类,不同类型的标签,用法和生成方式完全不一样。
- 事实标签:描述客观存在、基本不变的事实, 像性别、出生地、注册时间这种。它直接从原始数据里来,我们通常不额外加工。
- 规则标签:根据设定的规则,对数据进行加工后得到的。 如果要判断产品是不是热销产品(日销量Top10就是热销),需要提前设定好判断规则,由系统自动生成。说白了,就是定好规矩,让系统帮我们自动贴标签。
- 模型标签:通过算法模型预测出来。 比如预测一个用户“换机意愿强烈”或“有购房潜力”。它带有预测性,也是动态变化的。
2、做标签体系,比乱贴标签更重要。
新手最容易犯的错,就是追求数量,搞出几百个标签,最后没人维护也用不起来。用过来人的经验告诉你,标签贵在精,不在多。
你一定要从业务场景出发, 如果为了做新客首单转化活动,那么“新注册未下单”这个标签就至关重要。围绕三四个核心业务场景,梳理出几十个关键标签,远比一个庞大而空洞的标签库有用。
二、什么是数据指标?
有人会问,既然标签是描述,那指标是什么?
说白了,指标只负责衡量,它关心的是整体或某个方面,达到了什么水平。
还是用刚才的用户例子来说。
- 用户A的标签是“近30天登录过5次”,这是单纯的描述;
- 但如果我们统计“所有用户近30天平均登录次数”,这个数字就是指标。
还有电商行业里:
近7天销售额100万,某款产品的销售额50万,它们都是指标。
这些数字都能用来衡量某一件事、某一个业务的结果,能直接反映好坏、高低。
关于指标,我也总结了3个要点。
1、一个完整的指标由三部分组成。
- 维度: 从哪个角度看?比如“北京地区”、“90后用户”。
- 汇总方式: 怎么算?是求和、平均,还是计算比率?
- 量度: 单位是什么?是元、是次,还是百分比?
2、指标的定量属性,必须明确计算方式
指标具备定量属性,必须有数字,而且要有清晰的计算方式。
没有计算方式的数字,不能算作指标。
- 比如销售额的计算方式是客单价 × 成交数量;
- 登录率的计算方式是登录用户数 ÷ 总用户数 ×100%。
3、要统一口径,这一点我一直强调。
同一个指标,口径不一样,结果就不一样,很容易误导决策。
就拿日活用户来说,有的公司口径是“当天登录过一次就算日活”,有的是“当天登录超过10分钟才算日活”,两个部门统计结果不一样,根本没法对接工作。
所以,做数据工作,第一步就要统一指标口径,清楚计算方式和统计范围。
统一口径这事儿,实际做起来还真有点困难。 尤其是在数据来源多、业务变化快的公司。我最近发现,很多团队开始借助一些专业平台来固化这个流程。
像FineDataLink这样的数据集成与治理平台,就能帮上大忙。
它可以把来自ERP、CRM、埋点等不同系统的数据,按照统一的清洗、转换规则进行加工,然后入仓。在这个过程中,指标的口径定义和计算逻辑就被固化到数据开发的流程里了,从源头确保了一致性。
它还能把处理好的数据一键发布成标准的数据服务(Data API),供BI工具或业务系统调用,这样大家用的都是同源数据了。
三、分清区别
说了这么多,我们来直接对比一下。简单来说,它们从根上就不是干同一件事的。
不过话说回来,二者可以相互转化。
- 指标可以从标签转化而来, 比如“高净值客户迁移率”,高净值客户是标签,加上迁移率这个计算逻辑,就变成了指标;
- 标签也可以从指标转化而来, 比如“私行客户”这个标签,通常是设定AUM≥500万(AUM是指标)来定义的。
四、工作中怎么用?
日常做数据治理、数据集成,不管是做报表、做业务分析,还是做用户运营,标签和指标都得一起用,而且要用对顺序、用对方法。
结合标签和指标的分类,我分享两个最常用的方法。
1、先搭标签体系,再算指标,精准分析问题。
很多时候,我们只看指标,能发现问题,但找不到问题根源。这时候,就需要用不同类型的标签,拆解指标。
举个例子,上个月我们的用户转化率是15%,这个月降到了10%,只看指标,我们知道转化率下降了,但不知道是哪类用户的转化率下降了,没法针对性优化。
这时候,我们就可以用事实标签(新用户/老用户)、规则标签(高消费/低消费),对用户分层,然后分别计算每类标签用户的转化率。
最后发现,原来是新用户(事实标签)的转化率从20%降到了8%,老用户的转化率基本没变。
这样一来,问题就找到了,我们后续就可以重点优化新用户的运营策略,不用盲目发力。这种用法,在海量数据治理中,非常实用,你可以试试。
2、用标签圈定对象,用指标验证效果,覆盖多业务场景。
用户运营、产品推广,还有渠道管理,都能用这个方法。
如果你想推广一款高风险理财产品,可以先通过标签圈定“高净值客户”(规则标签)、“换机消费潜力旺盛”(模型标签)的用户,然后针对这群用户做推广活动。
活动结束后,用转化率、付费人数、客单价这些指标,验证活动效果。
- 如果转化率达到30%,说明目标对象圈定得很准;
- 如果转化率只有5%,说明标签圈定有问题,或者活动策略需要调整。
总结
做数据这么多年,我一直觉得,数据工作,把基础的概念搞懂,把关键的用法吃透,就能解决大部分的工作问题。
数据标签和数据指标, 就是数据工作最基础、最常用的两个概念,不管你是新手,还是有一定经验的同行,都值得花时间,把它们彻底搞懂。