数据可视化 | 青训营 前端

132 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的第4天

数据可视化

数据可视化的分类

  • 科学可视化
  • 信息可视化
  • 可视分析

可视化的设计原则和方法

错误的可视化会导致我们得到错误的信息却未发觉(misleading)

可视化的目标:正确表达数据中的信息而不产生误解和歧义。

一个出色的可视化设计可在最短时间内、使用最少的空间、最少的笔墨为观众提供最多的信息内涵。

可视化的设计原则:准确展示数据``节省笔墨``节省空间``消除不必要的无价值图形``在最短时间内传递最多的信息

最大墨水占比 Data-Ink Radio

可视化图形由墨水和空白区域构成

数据墨水(Data-ink):可视化图形中不可擦除的核心部分 数据墨水占比:可视化图形中用于展示核心数据的“墨水”在整体可视化所使用的墨水中的比例

Datainkradio=Dataink/totalinkusedtoprintthegraphicsData-ink radio = Data-ink / total ink used to print the graphics

提高最大墨水占比的两个擦除原则

  1. 擦除非数据墨水
  2. 擦除冗余的数据墨水

常见的数据可视化错误

  • 透视失真

    如果数字是由视觉元素表示,那么他们应该与视觉元素成正比。

    应该使用清晰、详细、和彻底的标签来标注具体的数值,避免图形失真和含糊不清

  • 图形设计&数据尺度

    图形的每一部分都会让人们产生对其的视觉预期

  • 数据上下文

    不仅需要图,我们还需要文字辅助我们去看懂图表

  • 谎言因子 Lie Factor

    谎言因子是衡量可视化所表达的数据量与数据之间的夸张程度的度量方法

    当 LF = 1 时,我们认为图表没有对数据实时进行扭曲,是一个可信的可视化设计 在实际当中,应当确保各部分图形元素的 LF 在 [0.95, 1.05] 范围内,否则,所产生的图 表认为已经丧失了基本可信度

谎言因子=数据所对应的图形元素的相对变化量/数据的真实变化量谎言因子 = 数据所对应的图形元素的相对变化量 / 数据的真实变化量

格式塔理论

格式塔学派的理论核心是整体决定部分的性质,部分依从于整体

  • 就近原则

    当视觉元素在空间距离上相聚教进时,人们会将他们归为一组 将数据元素放在靠近的位置可以突出它们之间的关联性

  • 相似性原则

    形状、大小、颜色强度等属性方面比较相似时,容易将这些物体看作一个整体

  • 连续性原则

  • 闭合性原则

  • 共势原则

    如果一个对象的一部分都向共同的方向去运动,那这些共同移动的部分就容易被感知为一个整体

  • 对称性原则

  • 图形与背景关系原则 Figure-ground

视觉编码

数据编码是一种将数据信息(属性+值)映射成可视化元素(可视化符号+视觉通道)的技术

可视化符号 Mark

用来表示元素时,Mark为线

用来表示关系时,Mark为闭包连线

视觉通道 Channel

数据通道

用于显示数据的数值属性

包括:位置、长度、角度、面积、深度、色温、饱和度、曲率、体积

标识通道

用于显示数据的分类属性

包括:空间区域、色相、动向、形状

面向前端的可视化工具

D3.js Vaga G2 Echarts

image.png