这是我参与「第五届青训营」伴学笔记创作活动的第 15 天,欢迎各位大佬批评指正。
数据可视化
概论
生活中各处都有数据可视化的存在,比如:统计图表、地图、体温计图等。因此:Anything that converts data into a visual representation,即 任何能够承载数据的可视化表达 都是数据可视化。
根据数据可视化处理的对象,可以划分三个分支:
- 科学可视化:科学实验数据直观展示。
- 信息可视化:对抽象数据的直观展示。
- 可视分析:对分析结果的直观展现及交互式反馈,是一个跨领域的方向。
为什么需要数据可视化:
- 记录信息
- 分析推理
- 证实假设
- 交流思想
可视化原则
能够正确表达数据,不产生偏差和歧义。
应该注意以下几种情况:
- 避免透视失真
- 图形设计/数据尺度一致
- 数据上下文完整
尽量做到:
- 准确展示数据
- 节省笔墨:
Data-ink Ratio最大数据墨水占比。 - 节省空间
- 消除不必要的无价值的图形
- 在最短时间内传递最多信息
An excellent visualization design gives to the viewer the greatest number of ideas in the shortest time with the leasting in the smallest space.
—— Edward R. Tufte
视觉感知
-
人类视觉系统观察是变化的,而不是绝对值,并且容易被边界吸引。
-
在可视化设计中,需要充分考虑人类感知系统的这些现象,以使得设计的可视化结果不会存在阻碍或误导用户的可视化元素。
-
格式塔学派:整体决定了部分的性质,部分依从于整体。结构比元素重要,视觉形象首先作为统一的整体被认知。感知的事物大于眼睛见到的事物。
- 就近原则:当视觉元素在空间距离上相距较近时,人们通常倾向将他们归为一组。
- 相似原则:形状、大小、颜色、强度相似,这些物体容易被看作一个整体。
- 连续性原则:观察事物的时候,会自然沿着物体边界,将不连续的物体看作一个整体。
- 闭合原则:有些物体可能是不完整/不封闭的,但主体有一种闭合的倾向,人们会自然感知整个物体忽略未闭合特征。
- 共势原则:如果一个对象的一部分都向着同一个方向运动,就会被感知为一个整体。
- 对称性原则:对称元素被视为同一组一部分。
- 图形与背景关系原则:一般认为图中最小的物体是图形,更大的是背景。并且凸面元素与图形关联更多。
视觉编码
视觉编码 是一种将数据信息(属性+值)映射为可视化元素(可视化符号+视觉通道)的技术。
- 可视化符号
用于可视化当中表现数据元素或者元素之间关系。
- 视觉通道
基于数据属性,控制可视化的符号展现样式。包括:数量通道、标识通道两种。
数据可视化工具
- D3.js
- Vega
- G2
- Echarts