本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究!
1.1 什么是可视化(What is Visualization)
在了解数据可视化的概念之前,我们先来了解“可视化”。按照维基百科对可视化的定义(en.wikipedia.org/wiki/Visual…
Visualization is any technique for creating images, diagrams, or animations to communicate a message
根据这个定义,我们可以理解为通过视觉元素(图像,图表,动画等等)来进行信息交流的方式都可以称之为可视化。比如下面的梵高的绘画,奥运会的ICon设计,一个具体的桑吉图都属于可视化。
(原图:星夜-文森特·梵高-1889)
(原图:www.visactor.io/vchart/demo…
(原图:www.pinterest.com/pin/5901827…)
这里应该还有一个更大的范畴定义,不仅局限于视觉,扩展到人类的整个感知系统。通过听觉、触觉或者味觉也是可以进行信息呈现和交流的。甚至针对盲人,也是可以设计优秀的可视化作品的。
1.2 什么是数据可视化(What is Data Visualization)
Anything that converts data into a visual representation (like charts, graphs, maps, sometimes even just tables)
“数据可视化”和“可视化”的定义很相似,只是增加了一个关键词——“数据”。
下面是几个典型的应用场景。
在科学可视化领域,数据可视化的作用主要是形象化的呈现,方便人们理解和查看。比如医学领域的扫描成像,可以大大提高医生探寻病因的效率。下面是一个人体内细胞运动的可视化作品,以壮美的方式呈现了人体内的微观世界(www.youtube.com/watch?v=NTg…
呈现数据关系的信息可视化是我们见到最多的可视化方式,比如下图通过地理信息以及连线展现唐代人物的迁徙轨迹(cbdb-qvis.pkudh.org/part1_migra…
在计算机诞生之前,可视化都是静态作品,人们只能通过看来理解数据。随着计算机图形的发展,交互成为一个重要研究方向,可视化和图形交互的融合,产生了探索式数据分析。比如下面的数据分析工具Tableau的交互界面(www.tableau.com)。
1.3 数据可视化作用(The role of data visualization)
直观展示
一图胜千言。数据可视化最直观的作用就是将数据要阐述的内容直观的展现出来,比如下面著名的“拿破仑东征图”。
Charles Joseph Minard,Map of Napolean's Russian Campaign of 1812
这个图表使用颜色标注了拿破仑进军莫斯科的路线图及败退路线,简单的可视化利用二维平面展现了包括空间、时间、气温、军队的人数等多个维度的信息,使得观察者可以通过一幅图了解整个历史事件的全貌。
数据探索
(Anscombe's quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个(x,y)点。这四组数据由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。
促进沟通与交流
由于可视化可以高效的阐释数据内含,合理的可视化设计可以更好的帮助作者表达其观点。比如下方的“南丁格玫瑰图((en.wikipedia.org/wiki/File:N…
• 各色块圆饼区均由圆心往外的面积来表现数字 • 蓝色区域:死于原本可避免的感染的士兵数 • 红色区域:因受伤过重而死亡的士兵数 • 黑色区域:死于其它原因的士兵数 • 1854 年 10 月、 1855 年 4 月的红黑区域恰好相等 • 1856 年 1 月与 2 月的蓝、黑区域恰好相等 • 1854 年 11 月红色区域中的黑线指出该月的黑色区域大小
出于对资料统计的结果会不受人重视的忧虑,弗洛伦斯·南丁格尔 发展出一种色彩缤纷的图表形式,让数据能够更加让人印象深刻。这张图表用以表达军医院季节性的死亡率,从整体上来看: 这张图是用来说明、比较战地医院伤患因各种原因死亡的人数,每块扇形代表着各个月份中的死亡人数,面积越大代表死亡人数越多。这幅图让政府相关官员了解到:改善医院的医疗状况可以显著的降低英军的死亡率。南丁格尔的方法打动了当时的高层,包括军方人士和维多利亚女王本人,于是医事改良的提案才得到支持,甚至挽救了千万人的生命
随着可视化的发展,人们使用更多的应用形式来 传递信息,比如仪表盘,数据大屏等。
1.4 数据可视化流程
一个可视化作品的诞生,要经历一系列流程,我们将其抽象成如下图所示的四个大的步骤。
(原图:vis.stanford.edu/files/2005-…
第一步 : 数据处理( Abstract Data ) 只有满足特定结构的数据才能做对应的可视化展现,而且为了达到好的可视化效果也需要对数据进行清洗、转换等操作。
第二步 : 可视化设计与表达( Visualization Design) 根据数据特征选择合适的展现模式,在此基础上通过合理的使用视觉编码,来定义最终的可视化展现内容。
第三步:可视化渲染( Rendering and Display)
将定义好的图形转换成为图像,展现给观众。
第四步:可视化交互( Interactivity)
单一的可视化结果并不能满足用户的多方面诉求,用户往往借助交互方式,进一步了解细节或者对数据进行筛选、聚合、分面等,对数据进行多方面的探索。
整个流程中涉及到的技术、工具、产品都属于数据可视化的研究范畴,由此可见,数据可视化是一个综合的、多学科交叉的领域。
1.5 小结
本节我们介绍了数据可视化的基本概念,下一节开始详细介绍数据的概念和分类。
相关资料
-
VisActor官网:visactor.io/
-
VisActor 开源:github.com/VisActor