浅谈数据可视化 | 青训营笔记

73 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的的第12天

可视化分类

科学可视化

科学数据的直观展示。

信息可视化

对抽象数据的直观展示。

可视分析

对分析结果的直观展示,及交互式反馈。跨领域的方向。

可视化设计原则及方法

为什么要进行可视化

  1. 记录信息
  2. 分析推理
  3. 证实假设
  4. 交流思想

常见错误的可视化

透视失真

依靠透视失真(近大远小)使绿色看起来更大

  • 如果数字是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比。
  • 使用清晰、详细和彻底的标签,以避免图形失真和含糊不清。

图形设计 & 数据尺度

图形的每一部分都会产生对应的视觉预期(visual expectation)

  • 这些预期往往决定了眼睛实际看到的东西
  • 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断。

数据上下文

要将数据长期的上下文展示出来,避免误判(断章取义)。

设计原则

一个出色的可视化设计可在最短的时间内,是用最少的空间、笔墨为观众提供最多的信息内涵。

  • 准确地展示数据
  • 节省笔墨
  • 节省空间
  • 消除不必要的“无价值”图形
  • 在最短时间内传达最多的信息

Data-Ink Ratio(最大化数据墨水占比)

  • 可视化图形由墨水和空白区域构成
  • 数据墨水:可视化图形当中不可擦出的核心部分
  • 擦除数据墨水将减少图形所传达的信息量
  • 数据墨水占比:

如何提高Data-Ink Ratio?

两个擦除原则:
  • 擦除非数据墨水
  • 擦除冗余的数据墨水
非数据墨水是指不能描述有价值信息的墨水
  • 有时,非数据墨水会使数据变得混乱不堪
  • 并非所有的非数据墨水都没有用(坐标轴信息)

视觉感知

格式塔理论

整体决定部分的性质,部分依从于整体。

就近原则(Proximity)

相似原则(Similarity)

形状、颜色、大小、强度等属性方面比较相似时,这些物体就容易被看作成一个整体。

连续性原则(Continuation)

人们在观察事物的时候会很自然的沿着物体的边界,将不连续的物体视为连续的整体。

闭合原则(Closure)

有些图形可能本身是不完整或者不闭合的,但主体有一种使其闭合的倾向,人们就会很容易地感知整个物体而忽略未闭合地特征。

共势原则(Common movement)

如果一个对象中的一部分都向共同的方向去运动,那么这些共同移动的部分就容易被感知成为一个整体。

对称性原则(Symmetry)

对称的元素被视为同一组的一部分。

图形与背景关系原则(Figure-ground)

  • 大脑通常认为构图中最小的物体是图形,而更大的物体则是背景。
  • 跟凹面元素相比,凸面元素与图形相关两更多些。

总结

视觉编码(Visual Encoding)

视觉编码是一种:将数据信息(key-value) 映射成可视化元素的技术

可视化符号(Mark)

用于在可视化当中表现数据元素或元素间的关联。

视觉通道(Channel)

基于数据属性,控制可视化的符号展现样式,例如,点根据其所代表的数据属性的不同可有不同的形状与颜色。

面向前端的可视化工具介绍

图形语法学: segmentfault.com/a/119000003…

  1. D3
  2. Vega:可视化语法,使用JSON格式描述外观和交互
  3. G2
  4. Echarts