数据可视化基础(1) | 青训营笔记

67 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的第4天

课程内容与目标

  1. 了解可视化的概念和基本原则
  2. 能够识别出不好的,甚至是有误导性的可视化呈现
  3. 了解一些面向前端的数据可视化根据

什么是数据可视化?

image.png

image.png

任何一种将数据转换为可视化形式的东西都是数据可视化的呈现:如图表、地图、绘画

数据可视化的分类

  1. 科学可视化:科学实验数据的直观展示
  2. 信息可视化:对抽象数据的直观展示
  3. 可视分析:对分析结果的直观展现,及交互方式反馈,是一个跨领域的方向
    是可视化、数据分析、人机交互的有机结合

为什么要数据可视化?

  1. 记录信息
  2. 分析推理
  3. 证实假设
  4. 交流思想

image.png

这四组数据的方差,标准差平均数都是相同的,直接看表格的话,显得很是杂乱,但经过二维散点图的表示之后,各个数据之间的关系更加明晰,清晰易懂

可视化设计原则和方法

糟糕的可视化呈现

image.png

错误的可视化呈现

image.png

常见的错误的可视化

1. 透视失真

  • 如果数组是由视觉元素表示的,那么它应该与视觉元素的感知程度成正比
  • 使用清晰、详细和彻底的标签,以避免图形失真和含糊不清

image.png

2. 图形设计&数据尺度

图形的每一部分都会产生对其的视觉预期

  • 这些预期往往决定了眼睛实际看到的东西
  • 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断 一个典型的例子:轴刻度,我们期望他从始至终能都保持连贯且一致

image.png

3. 数据上下文

image.png

- 单独拿出1955-1956的数据来看,确实因为出台的政策导致事故人数减少
- 但将近几年的数据全部统一对比,发现实际两者并没有太大相关性

可视化的设计原则

  • 能够正确的表达数据中的信息而不产生偏差和歧义

  • 一个出色的可视化设计能够在最短的时间里,使用最少的空间、用最少的笔墨为观众呈现最多的信息内涵 — Edward R.Tufte

  1. 准确的展示数据
  2. 节省笔墨
  3. 节省空间
  4. 消除不必要的“无价值”图形
  5. 在最短时间内传达最多信息

最大化数据墨水占比(Date-ink Ratio)

  • 可视化图形由墨水和空白区域组成

  • 数据墨水:可视化图形中不可擦除的部分被称之为“数据墨水”

  • 擦除数据墨水将减少图形所传达的信息

  • 数据墨水占比:可视化图形中用于展示核心数据的“墨水”在整体可视化中所使用的墨水的比例

    image.png

不同数据墨水占比的呈现效果

image.png