做数据也有一段时间了,总结下目前对于数据的理解;抽象来看数据分析,可以分为两部分:「归纳」和「演绎」两部分
归纳(总结经验)
归纳方法:用于由于「果」推导到「因」,一般用于特殊推导出一般的分析思路。一般从个体属性出发,寻找因子,总结出一个一般的特性。
实际业务中,一般业务发现异动,通过归纳来找出异动的因子,「解释」已发生的情况 但是归纳法常见的犯的错误是「以偏概全」「」,比如
- • 正向 case :只要出现 A ,都会有问题
- • 方向 case :只要不出现 A ,都不会有问题
- • 结论:A 是导致问题的主要原因
归纳法需要较长时间的连续观察,并需要注意收集「反向」例子,防止出现「以偏概全」的问题
演绎(验证理论)
演绎方法:由「因」推导出「果」,由一般推导出特殊的分析思路;演绎与归纳刚好相反,从一般整体出发,寻找事物直接的路径,从而得出某个个体的特性。
实际业务中,基于已总结出来的因子,用来预估和预测个体
- • 假设:出现 A 就会出现问题
- • case 1:出现 A 的时候,确实出现问题
- • case 2:没有出现 A 的时候,确实没有问题
演绎法可以快速得出结论,并指导业务实际动作,但要注意收集反向例子
方法缺陷
- • 归纳:幸存者偏差,可能成功只是特定类型
- • 演绎:幸存者偏差,测试数量偏少,环境单一
所以上面两种放放都需要交叉验证,好结论需要实际沉淀
数据分析流程
当有业务咨询你的时候,可以采用下面这个流程来进行问题诊断
- 1. 描述问题,是不是问题,问题是多少
- 2. 寻找标准,问题是什么,好还是不好
- 3. 寻找原因,为什么出现这个问题
- 4. 预测未来,问题未来会怎么样
- 5. 综合判断,问题综合结论
看问题
当遇到是多少问题的时候,本质还是指标体系 + 常规走势;常见的业务问题,都有下面这些套路
- • 渠道分析(漏斗分析 + 矩阵分析 + 结构分析)
- • 商品分析(ABC 分类 + 动销率/周转率 + LTV)
- • 产品分析(漏斗分析 + UJM)
- • 用户分析(价值分层 + RFM)
核心方式:指标 + 维度 + 看指标的方式
找标准
高手与菜鸟的区别标志,主要就是找标准;凡是遇到:大小,多少,快慢的判断,都需要标准,高手在讨论问题之前,先明确、共识标准
当然也有一些分析方法是自带标准的
- • 周期分析:时间序列对比来发现
- • 趋势分析:时间序列对比发现
- • 矩阵分析:四象限指标对比发现
- • 分层分析:二八原则与平均对比发现
找原因
清晰的过程和结果判断,是找原因的前提 简单分析,可以采用下面这些方法
- • 结构分析法:总销售额 = A 部门 + B 部门 + C 部门
- • 指标拆解法:总销售额 = 用户数 * 付费率 * 付费金额
- • 漏斗分析法:总销售额 = 流量 * 转化率* 客单价
涉及复杂业务问题,可以结合上面「归纳」 + 「演绎」的思路综合来看问题
预测未来
假设:未来走势与过去一样,过去的场景未来会重现;其中假设条件很重要,决定了预测方法 两种基本假设:
- • 过去走势未来会出现(时间序列发,滚动预测法)
- • 过去影响因子,未来会同样影响(因果关系法,业务假设法)
滚动预测法 假设有稳定的因子(留存率),可以滚动预测后续半年或者一年的留存用户情况
综合判断
凡是单一指标不能描述好坏的,都是综合判断的问题,关键:维度 + 权重 维度会出现很多,但是权重一般主要下面三种
- 一票否决
- 优先级
- 加权评分制
先讲这么多吧,关于数据分析其实还有很大一部分内容,后续补充