这是我参与「第四届青训营-大数据场」笔记创作活动的的第1天
这条笔记记录数据可视化建立流程。
数据可视化不是简单的视觉映射,而是一个以数据流向为主线的一个完整流程,主要包括数据采集、数据处理和变换、可视化映射、用户交互和用户感知。一个完整的可视化过程,可以看成数据流经过一系列处理模块并得到转化的过程,用户通过可视化交互从可视化映射后的结果中获取知识和灵感。 可视化主流程的各模块之间,并不仅仅是单纯的线性连接,而是任意两个模块之间都存在联系。例如,数据采集、数据处理和变换、可视化编码和人机交互方式的不同,都会产生新的可视化结果,用户通过对新的可视化结果的感知,从而又会有新的知识和灵感的产生。 下面具体介绍数据可视化流程:
- 数据采集 数据采集是数据分析和可视化的第一步,要注意数据采集的方法和质量,这样会很大程度上就决定了数据可视化的最终效果。
- 数据处理和变换 数据处理和数据变换,是进行数据可视化的前提条件,包括数据预处理和数据挖掘两个过程。 一方面,通过前期的数据采集得到的数据,不可避免的含有噪声和误差,数据质量较低;另一方面,数据的特征、模式往往隐藏在海量的数据中,需要进一步的数据挖掘才能提取出来。
- 可视化映射 对数据进行清洗、去噪,并按照业务目的进行数据处理之后,接下来就到了可视化映射环节。可视化映射是整个数据可视化流程的核心,是指将处理后的数据信息映射成可视化元素的过程。 可视化元素由3部分组成:可视化空间+标记+视觉通道,这里不详细叙述了。
- 人机交互 可视化的目的,是为了反映数据的数值、特征和模式,以更加直观、易于理解的方式,将数据背后的信息呈现给目标用户,辅助其作出正确的决策。 但是通常,我们面对的数据是复杂的,数据所蕴含的信息是丰富的。 如果在可视化图形中,将所有的信息不经过组织和筛选,全部机械的摆放出来,不仅会让整个页面显得特别臃肿和混乱,缺乏美感;而且模糊了重点,分散用户的注意力,降低用户单位时间获取信息的能力。
- 用户感知 可视化的结果,只有被用户感知之后,才可以转化为知识和灵感。 用户在感知过程,除了被动接受可视化的图形之外,还通过与可视化各模块之间的交互,主动获取信息。
这里就是今天总结的内容啦,若有问题可以评论留言,一起探讨,谢谢。