这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天
数据可视化概念与基本原则
可视化呈现方式多种多样,表格、图片,甚至地图都是数据可视化。
数据可视化分类:
- 科学可视化
- 信息可视化
- 可视分析:数据清理、数据挖掘、建模、分析、可视化
为什么要可视化
- 记录信息
- 分析推理
- 证实假设
- 交流思想
可视化设计原则
正确表达数据中的信息而不产生偏差与歧义。
需要注意的问题:
- 透视失真:数字大小应该与视觉元素的感知程度成正比
- 数据尺度:刻读应保持一致
- 数据上下文
最短时间、最少空间、最少笔墨
Data-ink ratio 最大化数据墨水比例 数据墨水:可视化图形中不可被擦除的核心部分。(并非所有非数据墨水都没有意义)
视觉感知
可视化其实是认知科学。人的视觉系统观察的是变化,而非绝对值,并且容易被边界吸引。可视化时需要注意利用人类特定的识别习惯。
格式塔学派:格式塔是德文Gestalt的译音,意即“模式、形状、形式”等,意思是指“动态的整体(dynamic wholes)”。
格式塔学派主张人脑的运作原理属于整体论,“整体不同于其部件的总和”。例如,我们对一朵花的感知,并非纯粹单单从对花的形状、颜色、大小等感官资讯而来,还包括我们对花过去的经验和印象,加起来才是我们对一朵花的感知1
被广泛用于视觉设计。
- 就近原则:靠近突出数据相关性
- 相似原则
- 连续性原则:人习惯沿着边界将不连续视为连续整体。
- 闭合原则
- 共势原则
- 对称性原则:对称容易被视为一部分
- 图形与背景原则:凸面图形占比高
视觉编码
将数据信息映射为可视化元素。
可视化符号:点线面 视觉通道:颜色大小。数量通道:连续变量?、标识通道:分类变量?
面向前端的可视化工具
可视化工具优缺点2
| 可视化工具 | 优势 | 缺点 |
|---|---|---|
| D3.js | 灵活,可定制程度高 | 命令式链式调用,学习曲线陡峭, 基于DOM无法操作WebGL |
| Vega | 声明式 JSON生成canvas或svg | 样式稍显老旧,偏学术 |
| G2 | 数据驱动、图形语法 | 丢失类型、稍显复杂 |
| Echarts | 三维可视化支持良好 | 复杂? |
总结
原理部分提供了数据可视化的方法论用于指导实践中的可视化。可视化工具部分介绍了当前前端可视化常用类库。