大数据可视化理论与案例分析 | 青训营笔记

179 阅读2分钟

这是我参与「第四届青训营 」 笔记创作活动的第16天

1. 定义

1.1 定义

可视化:

  • 通过视觉元素(图像,图表,动画等等)来进行信息交流的方式
  • 不仅局限于视觉,扩展到人类的整个感知系统。通过听觉、触觉或者味觉也是可以进行信息呈现和交流的。

数据可视化:

  • 将数据转换为可视化表示的任何内容(如图表、图形、地图,有时甚至只是表格)

  • 典型应用:地理信息、数据分析

    • 形象化呈现
    • 呈现数据关系的信息可视化
    • 信息和人交互,探索式数据分析

1.2 作用

  1. 信息呈现,信息展示
  2. 数据探索,比如
  3. 沟通媒介,比如南丁格玫瑰图

2. 原理

2.1 流程

img

第一步 : 数据处理( Abstract Data 只有满足特定结构的数据才能做对应的可视化展现,而且为了达到好的可视化效果也需要对数据进行清洗、转换等操作。

第二步 : 可视化设计与表达( Visualization Design) 根据数据特征选择合适的展现模式,在此基础上通过合理的使用视觉编码,来定义最终的可视化展现内容。

第三步:可视化渲染( Rendering and Display)

将定义好的图形转换成为图像,展现给观众。

第四步:可视化交互( Interactivity)

2.2 数据

数据可以被分为以下五种类别:

  • Items:具体的每一条数据
  • Attributes:条目的每个字段的属性
  • Links:数据之间的关系
  • Positions:位置
  • Grids:网格

数据集被分为以下五种类别:

  • Tables:表格数据,行列数据,可衍生为多维
  • Networks & Trees:网络图和树图,层次结构数据
  • Fields:场数据,向量的值
  • Geometry:几何数据,几何图形数据的几何
  • 其他集合类型:Clusters,Sets,Lists

一个数据集可以由一种或者多种数据类型组成,包含关系如下表:

img

数据属性氛围分离和排序属性,排序属性又可以分为顺序和定量两种类别

数据集类型决定我们选择什么样的可视化形式来展现数据,具体到展现的细节,则是由属性(Attribute)来决定。

2.3 可视化设计

编码,节省墨水,准确度

3. 案例

3.1 多维数据可视化

散点图平行坐标轴Glyph
imgimgimage-20220824232638303

3.2 树图可视化

区域分布地图等高线地图统计地图
imgimgimg

3.3 地理信息可视化

邻接图包含图邻接矩阵点线图
imgimgimgimg

3.4 叙事可视化

img