这是我参与「第四届青训营 」笔记创作活动的的第20天
今天是大数据专场基础班的第二十次课,主要内容是大数据可视化理论与案例分析,主要分为下面四个板块
一、 定义
1. 什么是可视化
- 可视化是用来创建图像、图表或动画以进行交互的任何技术
2. 什么是数据可视化
- 将数据转换为可视化表示的任何东西(如图表、图表、地图,有时甚至只是表)
3. 数据可视化作用
- 信息展示
- 数据探索
- 沟通媒介
二、 原理
1. 数据
1.1 定义
- 数据是可由计算机或人类存储和处理的有意义事实的集合
1.2 数据和数据集
1.3 表格
1.4 多维表格
1.5 属性分类
2. 编码
2.1 认知
- 原始视觉信号的感知,如颜色、形状等
- 模式识别
- 推理与分析
2.2 图元
- Items / Nodes
2. Links
2.3 通道
2.4 编码有效性
- 邻近原则(proximity)
- 相似原则(similarity)
- 连通性原则(Element Connectedness)
- 连续性原则(Good continuation)
- 封闭的原则(closure)
- 共同命运原则(common fate)
3. 分类
三、 案例
- 过多的分类会使得饼图的视觉效果趋于混乱
- 同样的数据,如果使用柱形图来显示,分类之间的对比就会明显很多
- 使用累积数据而不是年份数据,给观众造成逐年销量攀升的假象
- 另外没有明显的比例尺,看不出数据之间的实际差异
四、 学习
1. 综合
2. 实践
简易BI系统
- 数据集接入
- 数据查询
- 可视化展现
引用参考
内容主要参考了杨文海老师在「大数据可视化理论与案例分析」课程里所教授的内容,同时也参考了学员手册里第二节的内容,图片来自于老师的PPT,链接如下: