数据可视化基础 | 青训营笔记

108 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天

数据可视化概念与基本原则

可视化呈现方式多种多样,表格、图片,甚至地图都是数据可视化。

数据可视化分类:

  • 科学可视化
  • 信息可视化
  • 可视分析:数据清理、数据挖掘、建模、分析、可视化

为什么要可视化

  • 记录信息
  • 分析推理
  • 证实假设
  • 交流思想

可视化设计原则

正确表达数据中的信息而不产生偏差与歧义。

需要注意的问题:

  • 透视失真:数字大小应该与视觉元素的感知程度成正比
  • 数据尺度:刻读应保持一致
  • 数据上下文

最短时间、最少空间、最少笔墨

Data-ink ratio 最大化数据墨水比例 数据墨水:可视化图形中不可被擦除的核心部分。(并非所有非数据墨水都没有意义)

视觉感知

可视化其实是认知科学。人的视觉系统观察的是变化,而非绝对值,并且容易被边界吸引。可视化时需要注意利用人类特定的识别习惯。


格式塔学派:格式塔是德文Gestalt的译音,意即“模式、形状、形式”等,意思是指“动态的整体(dynamic wholes)”。

格式塔学派主张人脑的运作原理属于整体论,“整体不同于其部件的总和”。例如,我们对一朵花的感知,并非纯粹单单从对花的形状、颜色、大小等感官资讯而来,还包括我们对花过去的经验和印象,加起来才是我们对一朵花的感知1

被广泛用于视觉设计。

  • 就近原则:靠近突出数据相关性
  • 相似原则
  • 连续性原则:人习惯沿着边界将不连续视为连续整体。
  • 闭合原则
  • 共势原则
  • 对称性原则:对称容易被视为一部分
  • 图形与背景原则:凸面图形占比高

视觉编码

将数据信息映射为可视化元素。

可视化符号:点线面 视觉通道:颜色大小。数量通道:连续变量?、标识通道:分类变量?

面向前端的可视化工具

可视化工具优缺点2

可视化工具优势缺点
D3.js灵活,可定制程度高命令式链式调用,学习曲线陡峭, 基于DOM无法操作WebGL
Vega声明式 JSON生成canvas或svg样式稍显老旧,偏学术
G2数据驱动、图形语法丢失类型、稍显复杂
Echarts三维可视化支持良好复杂?

总结

原理部分提供了数据可视化的方法论用于指导实践中的可视化。可视化工具部分介绍了当前前端可视化常用类库。

Footnotes

  1. 格式塔学派wiki

  2. 如何挑选数据可视化框架及平台 - 前端篇