大数据可视化理论与案例分析 | 青训营笔记

190 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的第19天

1. 定义

1.1 什么是可视化

可视化是用来创建图像、图表或动画以进行交互的任何技术。

1.2 什么是数据可视化

数据可视化相对于可视化只增加了数据,呈现数据关系的信息可视化是最常见的可视化方式。

在计算机诞生之前,可视化都是静态的。随着计算机图形的发展,交互成为一个重要研究方向,产生了探索式数据分析。

1.3 数据可视化的作用

  • 直观展示
  • 数据探索
  • 促进沟通与交流

2. 数据可视化基本流程

2.1 数据采集

数据采集是数据分析和可视化的第一步,俗话说“巧妇难为无米之炊”,数据采集的方法和质量,很大程度上就决定了数据可视化的最终效果。 数据采集的分类方法有很多,从数据的来源来看,可以分为内部数据采集和外部数据采集。

2.2 数据处理和变换

数据处理和数据变换,是进行数据可视化的前提条件,包括数据预处理和数据挖掘两个过程。 一方面,通过前期的数据采集得到的数据,不可避免的含有噪声和误差,数据质量较低;另一方面,数据的特征、模式往往隐藏在海量的数据中,需要进一步的数据挖掘才能提取出来。

2.3 可视化映射

对数据进行清洗、去噪,并按照业务目的进行数据处理之后,接下来就到了可视化映射环节。可视化映射是整个数据可视化流程的核心,是指将处理后的数据信息映射成可视化元素的过程。

2.4 可视化交互

常见的交互方式有:

  • 滚动和缩放:当数据在当前分辨率的设备上无法完整展示时,滚动和缩放是一种非常有效的交互方式,比如地图、折线图的信息细节等。但是,滚动与缩放的具体效果,除了与页面布局有关系外,还与具体的显示设备有关。
  • 颜色映射的控制:一些可视化的开源工具,会提供调色板,如D3。用户可以根据自己的喜好,去进行可视化图形颜色的配置。这个在自助分析等平台型工具中,会相对多一点,但是对一些自研的可视化产品中,一般有专业的设计师来负责这项工作,从而使可视化的视觉传达具有美感。
  • 数据映射方式的控制:这个是指用户对数据可视化映射元素的选择,一般一个数据集,是具有多组特征的,提供灵活的数据映射方式给用户,可以方便用户按照自己感兴趣的维度去探索数据背后的信息。这个在常用的可视化分析工具中都有提供,如tableau、PowerBI等。

总结

这节课我学习了关于数据可视化的相关理论,数据可视化在未来的应用十分广泛。数据可视化能够加强数据的直观性,让人们更容易接收和理解数据,是一个十分重要的工具。

参考

  1. 【大数据专场 学习资料七】第四届字节跳动青训营 - 掘金 (juejin.cn)
  2. Timeline Storyteller