数据分析之必备技能---数据分析报告

3,492 阅读12分钟

数据分析报告的重要组成部分

数据分析报告核心目标

为什么要做数据分析报告?

通过数据驱动业务正常发展

image.png

  1. 产品方面:针对用户与商业
  2. 运营方面:运营过程中,会产生大量的数据,我们需要通过数据分析了解到我们的运营是否是有效的
  3. 自提方面:了解到自身的不足才可以更好的解决

数据分析报告的类型

数据分析报告包括产品分析报告和查询分析报告

产品分析报告

  • 明确目的(预期)

    • 对于产品分析报告,我们需要了解预期我们想达到一个什么目的

    是要去对产品做一个修正?还是优化某一个产品?最终带来什么收益

  • 确定分析纬度

    • 对于某一个产品我们需要从哪些角度分析

    从收益角度?从影响面角度?还是从针对性的用户角度?

  • 提取数据(正确的数据口径)

    • 对于不同的公司,或者同公司不同部门而已,数据的口径都是不一样的,提取的方式也有可能不一致

    确定数据的需求方和确认方,避免“无效数据分析”

  • 总结数据分析问题,或给出解决方案

    • 对于数据报告,需要通过报告发现应用中的问题,并且给出相对应的解决方案

    做事有头有尾

查询分析报告

  • 验证数据的口径(交叉验证)

    • 由于是查询分析报告,我们需要排除问题,对于数据的来源一定要确保正确性

    最好去排除的方法之一

  • 提出多种假设

    • 哪些方向最可能出现问题
  • 想办法验证假设

  • 给出结论和改进方案

数据分析报告核心要点

image.png

  1. 确定分析目的:我们需要知道我们为什么要做这份数据分析报告,确保我们可以很好的开展我们的工作
  2. 架构思路清晰:后续会细讲
  3. 数据准确性:这是需要重点注意的一点
  4. 选择合适的图表:数据分析报告中文字加图表的形式会更好的达到一个展示效果,不同的图表达到的数据展示效果不一样,所适合的数据关系也不一样
  5. 分析结论

确定分析目的

  1. 结果追溯:分析历史查找原因,论证结果
  2. 行业商机:挖掘要被满足的需求

挖掘需要被满足的需求

  1. 数据监控:评估、检测、监控
  2. 挖掘预测:指导未来实践的规律

架构思路清晰

  1. 明确数据分析报告类型( 产品分析报告、查询问题报告)
  2. 选择合适的数据分析框架进行问题拆解,比如AAARR、PEST等模型
  3. 输出分析数据,进行最终总结

数据准确性

  1. 数据源是否准确:数据分析师接触到的数据基本上是经过了数据清洗、数仓建模之后的下游数据数据,针对上游数据的要有准确性保障。
  2. 计算逻辑是否准确:要清楚所用下游数据表的逻辑和清洗规则,保证取了对的数据,并且计算逻辑没有问题。

选择合适图表

1、 柱状图

展示多个分类的数据变化和同类别各变量之间的比较情况。

  • 适用: 对比分类数据。
  • 局限: 分类过多则无法展示数据特点。
  • 相似图表:
    1. 堆积柱状图:比较同类别各变量和不同类别变量总和差异。
    2. 百分比堆积柱状图:适合展示同类别的每个变量的比例。

2、 条形图

类似柱状图,只不过两根轴对调了一下。

  • 适用: 类别名称过长,将有大量空白位置标示每个类别的名称。
  • 局限: 分类过多则无法展示数据特点 。
  • 相似图表:
    1. 堆积条形图:比较同类别各变量和不同类别变量总和差异。
    2. 百分比堆积条形图:适合展示同类别的每个变量的比例。
    3. 双向柱状图:比较同类别的正反向数值差异。

3、 折线图

展示数据随时间或有序类别的波动情况的趋势变化。

  • 适用: 有序的类别,比如时间。
  • 局限: 无序的类别无法展示数据特点。
  • 相似图表:
    1. 面积图:用面积展示数值大小。展示数量随时间变化的趋势。
    2. 堆积面积图:同类别各变量和不同类别变量总和差异。
    3. 百分比堆积面积图:比较同类别的各个变量的比例差异。

4、 柱状图

结合柱状图和折线图在同一个图表展现数据。

  • 适用: 要同时展现两个项目数据的特点。
  • 局限: 有柱状图和折线图两者的缺陷。

5、 散点图

用于发现各变量之间的关系。

  • 适用: 存在大量数据点,结果更精准,比如回归分析。
  • 局限: 数据量小的时候会比较混乱。
  • 相似图表: 气泡图:用气泡代替散点图的数值点,面积大小代表数值大小。

6、 饼图

用来展示各类别占比,比如男女比例。

  • 适用: 了解数据的分布情况。
  • 缺陷: 分类过多,则扇形越小,无法展现图表。
  • 相似图表:
  1. 环形图:挖空的饼图,中间区域可以展现数据或者文本信息。
  2. 玫瑰饼图:对比不同类别的数值大小。
  3. 旭日图:展示父子层级的不同类别数据的占比。

7、地图

用颜色的深浅来展示区域范围的数值大小。

  • 适合: 展现呈面状但属分散分布的数据,比如人口密度等。
  • 局限: 数据分布和地理区域大小的不对称。通常大量数据会集中在地理区域范围小的人口密集区,容易造成用户对数据的误解。
  • 相似图表:
  1. 气泡地图:用气泡大小展现数据量大小。
  2. 点状地图:用描点展现数据在区域的分布情况。
  3. 轨迹地图:展现运动轨迹。

8、 热力图

以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。

  • 适合: 可以直观清楚地看到页面上每一个区域的访客兴趣焦点。
  • 局限: 不适用于数值字段是汇总值,需要连续数值数据分布。

9、 矩阵树图

展现同一层级的不同分类的占比情况,还可以同一个分类下子级的占比情况,比如商品品类等。

  • 适用: 展示父子层级占比的树形数据。
  • 缺陷: 不适合展现不同层级的数据,比如组织架构图,每个分类不适合放在一起看占比情况。

10、 指标卡

突出显示一两个关键的数据结果,比如同比环比。

  • 适合: 展示最终结果和关键数据。
  • 缺陷: 没有分类对比,只展示单一数据。

11、词云

展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,比如用户画像的标签。

  • 适合: 在大量文本中提取关键词。
  • 局限: 不适用于数据太少或数据区分度不大的文本。

12、 仪表盘

展现某个指标的完成情况。

  • 适合: 展示项目进度。
  • 局限: 只适合展现数据的累计情况,不适用于数据的分布特征等。

13、 雷达图

将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点。

  • 适用: 了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。
  • 局限: 分类过多或变量过多,会比较混乱。

14、 漏斗图

用梯形面积表示某个环节业务量与上一个环节之间的差异。

  • 适用: 有固定流程并且环节较多的分析,可以直观地显示转化率和流失率。

  • 局限: 无序的类别或者没有流程关系的变量。

15、 瀑布图

采用绝对值与相对值结合的方式,展示各成分分布构成情况,比如各项生活开支的占比情况。

  • 适合: 展示数据的累计变化过程。
  • 局限: 各类别数据差别太大则难以比较。

16、 桑基图

一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,起始流量总和始终与结束流量总和保持平衡。比如能量流动等。

  • 适合: 用来表示数据的流向。

  • 局限: 不适用于边的起始流量和结束流量不同的场景。比如使用手机的品牌变化。

  • 相似图表: 和弦图:展现矩阵中数据间相互关系和流量变化,数据节点如果过多则不适用。

17、 箱线图

是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。

  • 适用: 用来展示一组数据分散情况,特别用于对几个样本的比较。
  • 局限: 对于大数据量,反应的形状信息更加模糊。

上述内容转载于:zhuanlan.zhihu.com/p/54849856

分析结论

  1. 基础表达:描述数据之间的对比、趋势和结构关系
  2. 进阶表达:在数据描述的基础.上结合对业务的分析和理解
  3. 高阶表达:结合业务的同时,阐述产生结论的原因和改进方向

做好数据分析报告的几点关键

  1. 懂业务、懂产品

    1. 好的数据分析师必须对业务和产品逻辑了解清晰
    2. 在不了解业务逻辑的情况下,可能得出错误的结论或者尽人皆知毫无价值的常识

只有了解清楚了业务逻辑,才可以更好的做数据分析

  1. 不要盲目追求模型

    1. 分析方法不在于高深,不在于要做模型,描述分析一样可以很出彩!

虽然数据分析很多模型,但是我们不止是为了将数据分析模型实现,我们分析报告应该追求美观的、有条理的把分析结果表达出来

  1. 基础数据处理很关键

    1. 掺杂脏数据,结果会有偏

由于我们数据来源于很多产品,数据清洗为落实做好就容易掺杂脏数据,导致分析结果的偏差

  1. 耐得住性子,才做得好分析

    1. 数据分析师必须很有耐心,数据运行起来可能很慢,做的过程可能会孤单
    2. 发现一个小纰漏,前面都得推翻重来

由于一直与数据、python、SQL打交道,有可能脚本在运行过程中相对较慢,工作过程中可能会产生孤独情绪

  1. 结论不在多,在于精

    1. 能捕捉眼球、推动改进现状的结论,一个报告有一两点就很不错了
    2. 长篇大论反而不能吸引注意

杜绝长篇大论的结论报告,针对主要问题进行分析总结

如何构建企业级数据分析报告

真实案例:互联网红包平台数据分析报告

从以下三个方面进行分析

  • 红包整体数据概况
  • 接入红包服务主要应用
  • 红包平台商业化实例

分析报告选择

针对红包这一产品进行分析,我们选择产品分析报告

红包整体数据概况

报告分析:

  • 红包整体的数据展示选择了直方图进行展示;所展示的数据包括红包数和用户数
  • 可以看出在2017年1月红包数到达了一个顶峰,在2017年2月有所减缓
  • 导致该现象的原因可能是2017年1月是春节期间,用户发放的红包数有所上涨
  • 另外,针对2017年1月期间的其它纬度数据进行了详细的描述

对春节期间红包发放的情况进行整体介绍

  • MIUI春节红包发放的量级最大,覆盖的用户数最多;
  • 成长体系发放的红包数最少,但拉活效果明显;
  • 应用商店发放用户数最少,但人均金额最高、人均个数最多;

接入红包服务主要的应用

  1. 广告曝光

接入业务:浏览器

形式:通过送红包活动形式,增加广告曝光

  1. 积分墙

接入业务:应用商店、短信等

形式:通过发红包形式鼓励用户下载app

  1. 拼手气

接入业务:成长体系

形式:通过发随机红包活动活跃用户,鼓励用户去做任务升级

  1. 其他

接入业务:保险、理财、小贷、公交卡等

形式:多为定向红包,给指定用户发放红包

红包平台商业化实例

MIUI春节红包

累计发放现金红包2227w个,发放金额31 8.5w,活动带来收入632.5w

成长体系春节红包

发放现金红包178w个,发放金额67.76w,活动带来收入163w。日均活跃345w (60.67%↑),PV 4839w( 88.48%↑),其中除夕当天最高507w(135.96%↑),PV7189w(180.02%↑),活动累计新增用户51.8w

应用商店春节红包

累计发放现金红包427.5w个,发放金额118.5w,日活提升了2.4%,活动带来收入约200w,日最高收入30w

红包金额对用户行为的影响

绑卡行为分析

结论:红包发放金额越大,用户绑卡欲望越强

新老用户行为分析

老用户促活比率为38.18%,核销率为27.43%,提现率10.65%

新用户拉新比率为3.64%,留存比率(消费)为0.86%, 提现率1.79%

结论:红包发放起到活跃用户的作用,用户领取红包金额越大,用户活跃度越高,消费提现占比越高,而老用户倾向去消费,新用户提现欲望较强;老用户比新用户更活跃。