数据可视化|青训营笔记

92 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 15 天。

什么是数据可视化

将数据转换为可视表示的任何内容(like charts,graphs,maps,sometimes even just tables)

数据可视化分类

  • 科学可视化:科学实验数据的直观数据
  • 信息可视化:对抽象数据的直观展示
  • 可视分析:对分析结果的直观展现,及交互式反馈,是一个跨领域的方向

为什么要数据可视化

  • 记录信息
  • 分析推理
  • 证实假设
  • 交流思想

可视化设计原则和方法

可视化设计原则

能够正确地表达数据中的信息而不产生偏差与歧义

原则

  • 准确的展示数据
  • 节省笔墨
  • 节省空间
  • 消除不必要的“无价值”图形
    • Data-ink Ratio 最大化数据水墨占比
      • 可视化图形由墨水和空白区域构成
      • 数据墨水:可视化图形当中不可擦除的核心部分被称为“数据墨水”
      • 擦除数据墨水将减少图形所传达的信息量
      • 数据水墨占比:可视化图形中用于展示核心数据的“墨水”在整体可视化所使用的墨水中的比例
      • Data-ink Ratio = Data-ink/Total ink used to print the graphics
  • 在最短的时间内传达最多的信息
    • 视觉感知
      • 可视化致力于外部认知,也就是说,怎样利用大脑以外的资源来增强大脑本身的认知能力
      • 视觉感知:客观事物通过人的视觉在人脑中形成的直接反映

常见的错误可视化

透视失真

  • 如果数字是由视觉元素表示的,那么它们应该与视觉元素的感知程度成正比
  • 使用清晰、详细和彻底的标签,以避免图形失真和含糊不清

图形设计&数据尺度

  • 图形的每一部分都会产生对其的视觉预期(visual expectation):
  • 这些预期往往决定了眼睛实际看到的东西
  • 错误的数据洞察,产生于在图形的某个地方发生的不正确的视觉预期推断

数据上下文

结论:

  • 人类视觉系统观察是变化的,而不是绝对值,并且容易被边界吸引
  • 在可视化设计中,设计者需要充分考虑到人类感知系统的这些现象,以使得设计的可视化结果不会存在阻碍或误导用户的可视化元素

格式塔理论

  • 就近原则
  • 相似原则
  • 连续性原则
  • 闭合原则
  • 共势原则
  • 对称性原则
  • 图形与背景关系原则

视觉编码

数据信息(属性+值) 映射成 可视化元素(可视化符号+视觉通道) 的技术

可视化符号

用于在可视化当中表现数据元素或元素之间的关联

视觉通道

基于数据属性,控制可视化符号的展现样式

视觉通道类型

  • 数量通道: 用于显示数据的数值属性(定量/定序),表示数值属性时,位置通道是最为精确的,其次是长度、角度、面积、深度、色温、饱和度、曲率、最后是体积
  • 标识通道: 用于显示数据的分类属性(是什么/在哪里),用于表示分类属性时,划分空间区域是最有效的,其次是色向、动向、形状。

前端可视化工具

D3,Vega(推荐),G2,echarts