常见数据处理顺序
- 调整并简化数据结构
- 多表合并
- 新增分析指标
调整并简化数据结构
调整数据结构
拆分行列
拆分成行时 ,需要进行以下设置
- 选择字段:需要拆分的字段
- 拆分方式:按分隔符号拆分, 例如空格、分号
拆分成列时,需要进行以下设置
- 选择字段:需要拆分的字段
- 拆分方式:按分隔符号拆分,例如空格、分号;额外可以选择按字符数来拆分
- 需要选择拆分的结果(前n列/第n列)
行列转换
- 转换行字段:新的表头
- 新列的值为:填充进列里的内容
简化数据
字段设置
- 修改字段类型-文本、数值、时间
- 重命名字段
- 调整字段顺序
- 隐藏字段
tips :很多操作在预览区域表头也能直接操作
删除重复行
- 去重逻辑:依据去重字段,保留最前面的一行
去除空值
- 大海里的一滴水”,放着不管,问题不大
- “害群之马不可留”,通过过滤,删除含
null
的数据 - “灵活分析要保留”,有业务含义时,打上标签,方便分析时过滤
小结
调整数据结构:
- 把数据处理成你要分析的维度和指标
相关功能:拆分行列、行列转换、字段设置
重复行:
- 系统的一些问题带来的两条完全一样的数据,直接去重
- 有业务含义的,需要有选择的去重,先排序再删除重复行
清理null值:
- “大海里的一滴水”,放着不管,问题不大
- “害群之马不可留”,通过过滤,删除含
null
的数据 - “灵活分析要保留”,有业务含义时,打上标签,方便分析时过滤
多表合并
上下合并
- 表格上下扩展时使用
- 匹配两表直接的字段即可
其他表添加列
- 类似于Excel中的
vlookup
、sumif
- 设置需要添加进来的字段,添加过程中可以进行计算
- 再设置匹配依据
什么是匹配依据?
匹配依据/合并依据
- 决定了数据在合并到另一张表时匹配到哪里的关键字段。
- 根据场景可能需要多选。
左右合并
左右合并
- 即sql中的
join
- 有左合并,右合并,并集合并,交集合并四种
左合并
右合并
并集合并
交集合并
常见问题:笛卡尔积
笛卡尔积的产生
小结
- 表格上下扩展,分析指标不变,就用上下合并
- 表格左右扩展,分析指标变多,先考虑其他表添加列
初学者记忆建议:
- 其他表添加列 =
vlookup
、sumif
(一般合并聚合指标) - 左右合并 =
leftjoin
、rightjoin
...(一般合并明细指标)
新增分析指标
常用按钮位置
- 在数据编辑中添加(禁止使用聚合函数)
- 在组件中添加计算字段
新增公式列
新增公式列
- 和excel写公式类似。也是我们最常用的新增字段方法
新增汇总列
新增汇总列
- 类似分组汇总; excel的数据透视。但不会破坏原有的表结构
新增赋值列
新增赋值列
- 类似写if条件
条件标签列
条件标签列
- 嵌套if条件时,用条件标签列可以更快配置好
时间差
时间差
- 快速计算两个时间字段的间隔
- 可以选择单位
获取时间
获取时间
- 提取时间字段中的具体时间
- 可以选择单位
- 输出的字段类型为数值
注:仅仅是需要得到一个分组的时间粒度,例如按月份统计销售额这样的情况,直接在组件中改变时间字段粒度即可