大数据可视化理论与案例分析 | 青训营笔记

168 阅读4分钟

这是我参与「第四届青训营 」笔记创作活动的第20天

本次学习是针对大数据可视化理论的分析和相关案例的展开和学习,收获颇丰!

1、可视化是什么?什么是数据可视化?

可视化是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,再进行交互处理的理论、方法和技术。

“数据可视化”和“可视化”的定义很相似,只是增加了一个关键词——“数据”。

Anything that converts data into a visual representation (like charts, graphs, maps, sometimes even just tables)

2、可视化的应用领域:

可视化最早运用于计算机科学中,并形成了可视化技术的一个重要分支——科学计算可视化(Visualization in Scientific Computing)。科学计算可视化能够把科学数据,包括测量获得的数值、图像或是计算中涉及、产生的数字信息变为直观的、以图形图像信息表示的、随时间和空间变化的物理现象或物理量呈现在研究者面前,使他们能够观察、模拟和计算。

3、可视化的优势和优点:

  • 有效呈现重要特征
  • 揭示客观规律
  • 辅助理解事物概念和过程
  • 对模拟和测量进行质量监控
  • 提高科研开发效率
  • 促进沟通交流和合作

数据可视化,最常见的莫过于各类条形图、折线图、饼图、雷达图等可由软件直接生成的图像,然而,这些图像局限于对特定数据的表达。复杂的应用场景也不断涌现,单纯的二维数据可视化不再满足物理世界的构建,基于地理环境信息的三维时空信息可视化场景及其真实感、实时性、动态交互一再被提及,三维可视化引擎逐渐走入人们视野,数字孪生可视化对地理空间数据、社会网络关系等多维数据进行可视化成像,被广泛利用。

4、数据可视化的作用:

  • 直观展示

一图胜千言,数据可视化最直观的作用就是将数据要阐述的内容直观的展现出来。

  • 数据搜索

(Anscombe's quartet)是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个(x,y)点。这四组数据由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。

  • 促进沟通与交流

由于可视化可以高效的阐释数据内含,合理的可视化设计可以更好的帮助作者表达其观点。 随着可视化的发展,人们使用更多的应用形式来 传递信息,比如仪表盘,数据大屏等。

5、数据可视化的基本步骤:

第一步 : 数据处理( Abstract Data 只有满足特定结构的数据才能做对应的可视化展现,而且为了达到好的可视化效果也需要对数据进行清洗、转换等操作。

第二步 : 可视化设计与表达( Visualization Design) 根据数据特征选择合适的展现模式,在此基础上通过合理的使用视觉编码,来定义最终的可视化展现内容。

第三步:可视化渲染( Rendering and Display)

将定义好的图形转换成为图像,展现给观众。

第四步:可视化交互( Interactivity)

单一的可视化结果并不能满足用户的多方面诉求,用户往往借助交互方式,进一步了解细节或者对数据进行筛选、聚合、分面等,对数据进行多方面的探索。

6、总结

学习了关于数据可视化的相关理论,数据可视化在未来的应用十分广泛。数据可视化能够加强数据的直观性,让人们更容易接收和理解数据,是一个十分重要的工具。

7、参考资料

juejin.cn/post/713013…

www.zhihu.com/question/34…