这是我参与「第四届青训营 」笔记创作活动的第4天
数据可视化
数据可视化的分类
- 科学可视化
- 信息可视化
- 可视分析
可视化的设计原则和方法
错误的可视化会导致我们得到错误的信息却未发觉(misleading)
可视化的目标:正确表达数据中的信息而不产生误解和歧义。
一个出色的可视化设计可在最短时间内、使用最少的空间、最少的笔墨为观众提供最多的信息内涵。
可视化的设计原则:准确展示数据``节省笔墨``节省空间``消除不必要的无价值图形``在最短时间内传递最多的信息
最大墨水占比 Data-Ink Radio
可视化图形由墨水和空白区域构成
数据墨水(Data-ink):可视化图形中不可擦除的核心部分 数据墨水占比:可视化图形中用于展示核心数据的“墨水”在整体可视化所使用的墨水中的比例
提高最大墨水占比的两个擦除原则
- 擦除非数据墨水
- 擦除冗余的数据墨水
常见的数据可视化错误
-
透视失真
如果数字是由视觉元素表示,那么他们应该与视觉元素成正比。
应该使用清晰、详细、和彻底的标签来标注具体的数值,避免图形失真和含糊不清
-
图形设计&数据尺度
图形的每一部分都会让人们产生对其的视觉预期
-
数据上下文
不仅需要图,我们还需要文字辅助我们去看懂图表
-
谎言因子 Lie Factor
谎言因子是衡量可视化所表达的数据量与数据之间的
夸张程度的度量方法当 LF = 1 时,我们认为图表没有对数据实时进行扭曲,是一个可信的可视化设计 在实际当中,应当确保各部分图形元素的 LF 在 [0.95, 1.05] 范围内,否则,所产生的图 表认为已经丧失了基本可信度
格式塔理论
格式塔学派的理论核心是整体决定部分的性质,部分依从于整体
-
就近原则
当视觉元素在空间距离上相聚教进时,人们会将他们归为一组 将数据元素放在靠近的位置可以突出它们之间的关联性
-
相似性原则
形状、大小、颜色强度等属性方面比较相似时,容易将这些物体看作一个整体
-
连续性原则
-
闭合性原则
-
共势原则
如果一个对象的一部分都向共同的方向去运动,那这些共同移动的部分就容易被感知为一个整体
-
对称性原则
-
图形与背景关系原则 Figure-ground
视觉编码
数据编码是一种将数据信息(属性+值)映射成可视化元素(可视化符号+视觉通道)的技术
可视化符号 Mark
用来表示元素时,Mark为点、线、面
用来表示关系时,Mark为闭包、连线
视觉通道 Channel
数据通道
用于显示数据的数值属性
包括:位置、长度、角度、面积、深度、色温、饱和度、曲率、体积
标识通道
用于显示数据的分类属性
包括:空间区域、色相、动向、形状
面向前端的可视化工具
D3.js
Vaga
G2
Echarts