数据可视化基础 | 青训营笔记

93 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的的第9天

1、什么是数据可视化

数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解所要表达的信息,从而提高沟通效率。

简单总结为将数据转换成可视化形式的东西(例如统计图,关系图,地图等)

  • 生活中的数据可视化

image-20220815214927109.png

2、数据可视化分类

  • 科学可视化

    围绕科学领域,包括科学医学领域的实验数据的直观展示

  • 信息可视化

    更加抽象的或非结构化的数据结合,包括文本或层次结构或地图的直观展示

3、为什么要数据可视化

数据可视化可以记录信息,进行分析推理证实假设,包括思想的交流

【举例:安斯库姆四重奏】

以下表格有四组二维数据的点集,如何找出这些数据的差异

image-20220815215710878.png

通过二维的数据可视化,可以很快发现,这四组数据具有非常不一样的分布规律,所以可以通过数据可视化进行分析推理

image-20220815215728670.png

4、可视化设计原则和方法

  • 错误的可视化呈现 image-20220815220246294.png

    这些可视化很有可能会带来误导

可视化设计原则

能够正确地表达数据中的信息而不产生偏差与歧义

常见的错误可视化
  • 透视失真

    image-20220815220920821.png

由于近大远小,绿色和紫色发生了透视失真,绿色看起来比紫色大一点,为此达到了宣传的目的

  • 图形设计&数据尺度

    image-20220815221126385.png

从0到60,每个大格间隔区间为20,而从60到260每个大格间隔为40,如果把60给抹掉,让我们自己联想,我们可能会想成80,也就是错误的判断了

  • 数据上下文

    image-20220815221441199.png

    数据上下文要补全

衡量可视化设计原则是否优秀

image-20220815223327614.png

最大化数据墨水占比(Data-Ink Ratio)

image-20220815223628483.png

image-20220815223651186.png

image-20220815223704673.png

提高Data-Ink Ratio

image-20220815223733670.png

可视化设计方法
  • 最重要的是展现数据

  • 合理范围内,最大化数据墨水占比

    • 擦除非数据墨水
    • 擦除冗余的数据墨水

5、视觉感知

可视化致力于外部认知,也就是说,怎样利用大脑以外的资源来增强大脑本身的认知能力

什么是视觉感知

感知:指客观事物通过人的感觉器官在人脑中形成的直接反映

感觉器官:眼、耳、鼻、神经末梢

视觉感知:就是客观事物通过人的视觉在人脑中形成的直接反映

认知过程

image-20220815224734394.png

相对判断和视觉假象

image-20220815224918222.png

找出3

image-20220815224927289.png

AB方块颜色是一样的

结论
  • 人类视觉系统观察的是变化,而不是绝对值,并且容易被边界吸引
  • 在可视化设计中,设计者需要充分考虑到人类感知系统的这些现象,以使得设计的可视化结果不会存在阻碍或误导用户的可视化元素
格式塔理论
格式塔学派

image-20220815225213231.png

格式塔理论

image-20220815225243888.png

格式塔理论原则

image-20220815225347383.png

image-20220815225423594.png

image-20220815225432010.png

image-20220815225440830.png

image-20220815225451735.png

image-20220815225458728.png

image-20220815225505410.png

image-20220815225514981.png

6、视觉编码

视觉编码(Visual Encoding)

image-20220815225610341.png

可视化符号(Mark)

image-20220815225929716.png

视觉通道

image-20220815225948700.png

视觉编码的优先级

image-20220815230009256.png

7、前端可视化工具库

8、总结

数据可视化能够让用户从大量数据中直观得得到最有用的、最有价值的数据,数据通过图表或图形等显示出来,能够让用户轻松识别,数据更加易于理解,并从中得到需要的结论。并且数据可视化的表现形式非常多样,也可以借助前端可视化工具库。能够正确恰当地使用数据可视化,是我们需要学习和为之努力的。