数据可视化基础 | 青训营笔记

89 阅读2分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 14 天。

今日学习内容:数据可视化基础

一、什么是数据可视化

所有将数据转换成为视觉效果上的呈现方式(比如表格、图片、地图等)

image.png

可视化分类包括:

  1. 科学可视化:科学实验数据的直观展示
  2. 信息可视化:对抽象数据的直观展示
  3. 可视分析:对分析结果的直接展现,及交互式反馈,是一个跨领域的方向

为什么要可视化?

  • 记录信息
  • 分析推理
  • 证实假设
  • 交流思想

二、可视化设计原则与方法

能够正确地表达数据中的信息而不产生歧义和偏差

常见的错误可视化有:

  • 透视失真

    image.png

  • 图形设计 & 数据尺度问题

    image.png

  • 数据上下文问题

    image.png

1. 透视失真

如果数字是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比

使用清晰、详细和彻底的标签,以避免图形失真和模糊不清

2. 图形设计与数据尺度

图形的每一部分都会产生对其的视觉预期

  • 这些预期往往决定了眼睛实际看到的东西
  • 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断

3. 数据上下文

image.png

4. 谎言因子

我们需要控制图形中的谎言因子(LF),即衡量可视化中所表达的数据量与数据之间的夸张程度的度量方法

image.png

  • 当LF = 1时,我们认为图标没有对数据实时进行扭曲,是一个可信的可视化设计
  • 在实际中,应当确保各部分图形元素的LF在[0.95, 1.05]范围内,否则所产生的图表认为已经丧失了基本可信度

5. 可视化设计原则

image.png

image.png

如何提高Data-ink ratio?两个擦除原则:

  1. 擦除非数据墨水
  2. 擦除冗余的数据墨水
  • 非数据墨水指不能描绘有价值信息的墨水
    • 有时,非数据墨水会使数据变得模糊不堪
    • 并非所有的非数据墨水都没有用(坐标轴信息)
  • 冗余的数据墨水描述了信息,但他重复显示了信息

三、视觉感知

可视化致力于外部认知,也就是说,怎样利用大脑以外的资源来增强大脑本身的认知能力

感知:客观事物通过人的感觉器官在人脑中形成的直接反映

感觉器官:眼、耳、鼻、神经末梢

那么,视觉感知就是客观事物通过人的视觉在人脑中形成的直接反映

image.png