这是我参与「第四届青训营 」笔记创作活动的的第14天
数据可视化基础
大家好,这里是努力写项目的Vic,今天给大家带来数据可视化基础的相关内容。
什么是数据可视化
数据可视化指的就是将数据通过图表等形式装换为可以用肉眼直观判别的表达形式。
数据可视化分为三类,分别为:科学可视化、信息可视化、可视分析。
可视化有助于记录信息、分析推理、证实假设、交流思想。
可视化设计原则和方法
可视化设计原则:能够正确地表达数据中的信息而不产生偏差与歧义。
常见的可视化错误:透视失真、图形设计和数据尺度问题、数据上下文。
透视失真:如果数据是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比。
图形设计和数据尺度问题:图形的每一部分都会产生对其的视觉预期,这些预期往往决定了眼睛实际看到的东西,错误的数据洞察产生于图形的某个地方发生的不正确的视觉预期推断。
没有联系的数据上下文会产生对于数据判定的错误。
优秀的可视化设计还应遵循:1、节省笔墨,2、节省空间,3、消除不必要的无价值图形,4、在最短的时间内传递最多的信息。
视觉感知
格式塔理论:整体决定部分的性质,部分依存于整体。分为七大原则:
- 就近原则;
- 相似原则;
- 连续性原则;
- 闭合原则;
- 共势原则;
- 对称性原则;
- 图形与背景关系原则。
视觉编码
可视化符号:用于在可视化当中表现数据元素或元素之间的关联。点、线、面表示元素,闭包、连线表示关系。
视觉通道:基于数据属性,控制可视化符号展现样式。分为两种:数量通道(用于显示数据的数值属性)、标识通道(用于显示数据的分类属性)。
基础统计图表
柱状图(表现数量)
饼图(表现占比)
散点图(表现位置信息,适用于分析相关性强弱)
折线图(表现数据变化)