这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天。
什么是数据可视化
将数据转换为可视表示的任何内容(like charts,graphs,maps,sometimes even just tables)
数据可视化分类
- 科学可视化:科学实验数据的直观数据
- 信息可视化:对抽象数据的直观展示
- 可视分析:对分析结果的直观展现,及交互式反馈,是一个跨领域的方向
为什么要数据可视化
- 记录信息
- 分析推理
- 证实假设
- 交流思想
可视化设计原则和方法
可视化设计原则
能够正确地表达数据中的信息而不产生偏差与歧义
原则
- 准确的展示数据
- 节省笔墨
- 节省空间
- 消除不必要的“无价值”图形
- Data-ink Ratio 最大化数据水墨占比
- 可视化图形由墨水和空白区域构成
- 数据墨水:可视化图形当中不可擦除的核心部分被称为“数据墨水”
- 擦除数据墨水将减少图形所传达的信息量
- 数据水墨占比:可视化图形中用于展示核心数据的“墨水”在整体可视化所使用的墨水中的比例
- Data-ink Ratio = Data-ink/Total ink used to print the graphics
- Data-ink Ratio 最大化数据水墨占比
- 在最短的时间内传达最多的信息
- 视觉感知
- 可视化致力于外部认知,也就是说,怎样利用大脑以外的资源来增强大脑本身的认知能力
- 视觉感知:客观事物通过人的视觉在人脑中形成的直接反映
- 视觉感知
常见的错误可视化
透视失真
- 如果数字是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比
- 使用清晰、详细和彻底的标签,以避免图形失真和含糊不清
图形设计&数据尺度
- 图形的每一部分都会产生对其的视觉预期(visual expectation):
- 这些预期往往决定了眼睛实际看到的东西
- 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断
数据上下文
结论:
- 人类视觉系统观察是变化的,而不是绝对值,并且容易被边界吸引
- 在可视化设计中,设计者需要充分考虑到人类感知系统的这些现象,以使得设计的可视化结果不会存在阻碍或误导用户的可视化元素
格式塔理论
- 就近原则
- 相似原则
- 连续性原则
- 闭合原则
- 共势原则
- 对称性原则
- 图形与背景关系原则
视觉编码
将 数据信息(属性+值) 映射成 可视化元素(可视化符号+视觉通道) 的技术
可视化符号
用于在可视化当中表现数据元素或元素之间的关联
视觉通道
基于数据属性,控制可视化符号的展现样式
视觉通道类型
- 数量通道: 用于显示数据的数值属性(定量/定序),表示数值属性时,位置通道是最为精确的,其次是长度、角度、面积、深度、色温、饱和度、曲率、最后是体积
- 标识通道: 用于显示数据的分类属性(是什么/在哪里),用于表示分类属性时,划分空间区域是最有效的,其次是色向、动向、形状。
前端可视化工具
D3,Vega(推荐),G2,echarts