数据可视化基础 | 青训营笔记

105 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 18 天

什么是数据可视化

狭义上的数据可视化指的是数据用统计图表方式呈现,而信息可视化则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。

数据可视化研究的是,如何将数据转化成为交互的图形或图像等,以视觉可以感受的方式表达,增强人的认知能力,达到发现、解释、分析、探索、决策和学习的目的。

广义的数据可视化涉及信息技术、自然科学、统计分析、图形学、交互、地理信息等多种学科。

数据可视化分类

  • 科学可视化(科学实验数据的直观展示)
  • 信息可视化(对抽象数据的直观展示)
  • 可视化分析(对分析结果的直观展示,及交互式反馈,是一个跨领域的方向)

为什么要数据可视化

  1. 记录信息
  2. 分析推理
  3. 证实假设
  4. 交流思想

数据可视化的本质是将数据通过各种视觉通道映射成图形,可以使得用户更快、更准确的理解数据。因此数据可视化要解决的问题是如何将数据通过视觉可观测的方式表达出来,同时需要考虑美观、可理解性,需要解决在展示的空间(画布)有限的情况下覆盖、杂乱、冲突等问题,再以交互的形式查看数据的细节。

可视化设计原则

能够正确的表达数据中的信息而不产生偏差与歧义

常见的错误可视化

  1. 透视失真
  2. 图形设计&数据尺度
  3. 数据上下文 透视失真:
  • 如果数字是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比。
  • 使用清晰,详细和彻底的标签,以避免图形失真和含糊不清。 图形设计&数据尺度:
  • 图形的每一部分都会产生对其的视觉预期
  • 这些预期往往决定了眼睛实际看到的东西。
  • 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断。

谎言因子

  • 控制图形中的谎言因子

    • 谎言因子:衡量可视化中所表达的数据量于数据之间的夸张程度的度量方法
    • 谎言因子 = 数据所对应的图形元素的相对变化量 % 数据的真实变化量
  • 当LF=1时,我们认为图表命运对数据实时进行扭曲,是一个可信的可视化设计。

  • 在实际当中,应当确保各个部分的图形元素的LF在{0.9,1.05}范围内,否则,所产生 图标认为以及丧失基本的可信度。

可视化设计原则

一个出色的可视化设计可在最短的时间内。使用最少的空间,用最少的笔墨为观众提供最多的信息内涵。

总结:

  • 准确的展示数据
  • 节省笔墨
  • 节省空间
  • 消除不必要的,“无价值”的图形
  • 在最短的时间内传达最多的信息

了解一些可视化基础概念

可视化工具推荐

  • D3.js 是用于数据可视化的开源JavaScript函数库,被认为是最好的JavaScript可视化框架之一。

  • Vega 是一种可视化声明式语法

  • G2 可视化引擎