数据可视化极简教程(一)数据可视化的定义

575 阅读6分钟

本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究!


1.1 什么是可视化(What is Visualization)

在了解数据可视化的概念之前,我们先来了解“可视化”。按照维基百科对可视化的定义(en.wikipedia.org/wiki/Visual…

Visualization is any technique for creating images, diagrams, or animations to communicate a message

根据这个定义,我们可以理解为通过视觉元素(图像,图表,动画等等)来进行信息交流的方式都可以称之为可视化。比如下面的梵高的绘画,奥运会的ICon设计,一个具体的桑吉图都属于可视化。

(原图:星夜-文森特·梵高-1889)

(原图:www.visactor.io/vchart/demo…

(原图:www.pinterest.com/pin/5901827…)

这里应该还有一个更大的范畴定义,不仅局限于视觉,扩展到人类的整个感知系统。通过听觉、触觉或者味觉也是可以进行信息呈现和交流的。甚至针对盲人,也是可以设计优秀的可视化作品的。

1.2 什么是数据可视化(What is Data Visualization)

Anything that converts data into a visual representation (like charts, graphs, maps, sometimes even just tables)

“数据可视化”和“可视化”的定义很相似,只是增加了一个关键词——“数据”。

下面是几个典型的应用场景。

在科学可视化领域,数据可视化的作用主要是形象化的呈现,方便人们理解和查看。比如医学领域的扫描成像,可以大大提高医生探寻病因的效率。下面是一个人体内细胞运动的可视化作品,以壮美的方式呈现了人体内的微观世界(www.youtube.com/watch?v=NTg…

呈现数据关系的信息可视化是我们见到最多的可视化方式,比如下图通过地理信息以及连线展现唐代人物的迁徙轨迹(cbdb-qvis.pkudh.org/part1_migra…

在计算机诞生之前,可视化都是静态作品,人们只能通过看来理解数据。随着计算机图形的发展,交互成为一个重要研究方向,可视化和图形交互的融合,产生了探索式数据分析。比如下面的数据分析工具Tableau的交互界面(www.tableau.com)。

1.3 数据可视化作用(The role of data visualization)

直观展示

一图胜千言。数据可视化最直观的作用就是将数据要阐述的内容直观的展现出来,比如下面著名的“拿破仑东征图”。

Charles Joseph Minard,Map of Napolean's Russian Campaign of 1812

这个图表使用颜色标注了拿破仑进军莫斯科的路线图及败退路线,简单的可视化利用二维平面展现了包括空间、时间、气温、军队的人数等多个维度的信息,使得观察者可以通过一幅图了解整个历史事件的全貌。

数据探索

(Anscombe's quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个(x,y)点。这四组数据由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。

促进沟通与交流

由于可视化可以高效的阐释数据内含,合理的可视化设计可以更好的帮助作者表达其观点。比如下方的“南丁格玫瑰图((en.wikipedia.org/wiki/File:N…

 各色块圆饼区均由圆心往外的面积来表现数字  蓝色区域:死于原本可避免的感染的士兵数  红色区域:因受伤过重而死亡的士兵数  黑色区域:死于其它原因的士兵数  1854  10 月、 1855  4 月的红黑区域恰好相等  1856  1 月与 2 月的蓝、黑区域恰好相等  1854  11 月红色区域中的黑线指出该月的黑色区域大小

出于对资料统计的结果会不受人重视的忧虑,弗洛伦斯·南丁格尔 发展出一种色彩缤纷的图表形式,让数据能够更加让人印象深刻。这张图表用以表达军医院季节性的死亡率,从整体上来看: 这张图是用来说明、比较战地医院伤患因各种原因死亡的人数,每块扇形代表着各个月份中的死亡人数,面积越大代表死亡人数越多。这幅图让政府相关官员了解到:改善医院的医疗状况可以显著的降低英军的死亡率。南丁格尔的方法打动了当时的高层,包括军方人士和维多利亚女王本人,于是医事改良的提案才得到支持,甚至挽救了千万人的生命

随着可视化的发展,人们使用更多的应用形式来 传递信息,比如仪表盘,数据大屏等。

1.4 数据可视化流程

一个可视化作品的诞生,要经历一系列流程,我们将其抽象成如下图所示的四个大的步骤。

(原图:vis.stanford.edu/files/2005-…

第一步 : 数据处理( Abstract Data 只有满足特定结构的数据才能做对应的可视化展现,而且为了达到好的可视化效果也需要对数据进行清洗、转换等操作。

第二步 : 可视化设计与表达( Visualization Design) 根据数据特征选择合适的展现模式,在此基础上通过合理的使用视觉编码,来定义最终的可视化展现内容。

第三步:可视化渲染( Rendering and Display)

将定义好的图形转换成为图像,展现给观众。

第四步:可视化交互( Interactivity)

单一的可视化结果并不能满足用户的多方面诉求,用户往往借助交互方式,进一步了解细节或者对数据进行筛选、聚合、分面等,对数据进行多方面的探索。

整个流程中涉及到的技术、工具、产品都属于数据可视化的研究范畴,由此可见,数据可视化是一个综合的、多学科交叉的领域。

1.5 小结

本节我们介绍了数据可视化的基本概念,下一节开始详细介绍数据的概念和分类。

相关资料