BI学习笔记(Day 5)——数据专题

54 阅读4分钟

常见数据处理顺序

  1. 调整并简化数据结构
  2. 多表合并
  3. 新增分析指标

调整并简化数据结构

调整数据结构

拆分行列

image.png

拆分成时 ,需要进行以下设置

  • 选择字段:需要拆分的字段
  • 拆分方式:按分隔符号拆分, 例如空格、分号

相关链接


image.png

拆分成列时,需要进行以下设置

  • 选择字段:需要拆分的字段
  • 拆分方式:按分隔符号拆分,例如空格、分号;额外可以选择按字符数来拆分
  • 需要选择拆分的结果(前n列/第n列)

相关链接

行列转换

image.png

  • 转换行字段:新的表头
  • 新列的值为:填充进列里的内容

相关链接

简化数据

字段设置

  • 修改字段类型-文本、数值、时间
  • 重命名字段
  • 调整字段顺序
  • 隐藏字段

tips :很多操作在预览区域表头也能直接操作

相关链接

删除重复行

image.png

  • 去重逻辑:依据去重字段,保留最前面的一行

相关链接

去除空值

image.png

  1. 大海里的一滴水”,放着不管,问题不大
  2. “害群之马不可留”,通过过滤,删除含null的数据
  3. “灵活分析要保留”,有业务含义时,打上标签,方便分析时过滤

小结

调整数据结构:

  1. 把数据处理成你要分析的维度和指标
    相关功能:拆分行列、行列转换、字段设置

重复行:

  1. 系统的一些问题带来的两条完全一样的数据,直接去重
  2. 有业务含义的,需要有选择的去重,先排序删除重复行

清理null值:

  1. “大海里的一滴水”,放着不管,问题不大
  2. “害群之马不可留”,通过过滤,删除含null的数据
  3. “灵活分析要保留”,有业务含义时,打上标签,方便分析时过滤

多表合并

上下合并

image.png

  • 表格上下扩展时使用
  • 匹配两表直接的字段即可

相关链接

其他表添加列

屏幕截图 2025-01-28 143838.png

  • 类似于Excel中的 vlookupsumif
  • 设置需要添加进来的字段,添加过程中可以进行计算
  • 再设置匹配依据

相关链接

什么是匹配依据?

屏幕截图 2025-01-28 144404.png

匹配依据/合并依据

  • 决定了数据在合并到另一张表时匹配到哪里的关键字段。
  • 根据场景可能需要多选。

左右合并

image.png

左右合并

  • 即sql中的join
  • 有左合并,右合并,并集合并,交集合并四种

相关链接

左合并

image.png

相关链接

右合并

image.png

相关链接

并集合并

image.png

相关链接

交集合并

image.png

相关链接

常见问题:笛卡尔积

笛卡尔积的产生

image.png

相关链接

小结

  1. 表格上下扩展,分析指标不变,就用上下合并
  2. 表格左右扩展,分析指标变多,先考虑其他表添加列

初学者记忆建议:

  • 其他表添加列 = vlookupsumif(一般合并聚合指标)
  • 左右合并 = leftjoinrightjoin...(一般合并明细指标)

新增分析指标

常用按钮位置

  1. 在数据编辑中添加(禁止使用聚合函数)
  2. 在组件中添加计算字段

新增公式列

新增公式列

  • 和excel写公式类似。也是我们最常用的新增字段方法

相关链接

新增汇总列

image.png

新增汇总列

  • 类似分组汇总; excel的数据透视。但不会破坏原有的表结构

相关链接

新增赋值列

image.png

新增赋值列

  • 类似写if条件

相关链接

条件标签列

image.png

条件标签列

  • 嵌套if条件时,用条件标签列可以更快配置好

相关链接

时间差

image.png

时间差

  • 快速计算两个时间字段的间隔
  • 可以选择单位

相关链接

获取时间

image.png

获取时间

  • 提取时间字段中的具体时间
  • 可以选择单位
  • 输出的字段类型为数值

:仅仅是需要得到一个分组的时间粒度,例如按月份统计销售额这样的情况,直接在组件中改变时间字段粒度即可

相关链接