大数据可视化理论与案例分析 | 青训营笔记

100 阅读4分钟

这是我参与「第四届青训营 」笔记创作活动的第5天

大数据可视化的定义

大数据可视化是通过一些动画,图表等视觉元素,对科学原理,社会现象,客观规律等进行形象化的呈现。随着计算机技术的进步,可视化作品逐渐由静态转化为动态。

大数据可视化的作用

南丁格尔玫瑰图:作为一种沟通媒介,对于伤员后期护理的情况进行医护手段改进的可视化工具。
拿破仑东征图:最好的可视化作品之一,是信息图中的经典之作,描述了1812年拿破仑东征俄罗斯的失败战役

编码有效性(在模式识别中的开发者需要遵循的原则)

邻近原则 :分组柱状图,位置的远近展现出来

相似原则 :不同的形状表示不同的分类

连通性原则 : 上下两条连线可以表示数据的区间 连续性原则 : 折线图

封闭的原则 : 与连通性原则相似,将图作为一个整体

共同命运原则 : 有共同的运动趋势

分类/Interaction Categories

设备移动端交互进行场景的具体划分和设计。对用户的分面表达,对数据进行过滤,对数据层面展示进行区分

  1. 过多的分类会使得饼图的视觉效果过于明显,会对用户
  2. 同样的数据,如果是用柱状图来显示,分类之间的对比就回明显很多
  3. 非0基线造成的数据扭曲,会让用户对数据数值大小产生一定的视觉上的差错。
  4. 在苹果某年发布会现场,柱状图使用累积数据而不是年份的数据,给人销量逐年攀升的假象。
  5. 另外可视化图中没有明显的比例尺,看不出数据之间的差异。

image.png

饼图相对于柱状图,颜色区分度不大,展示效果不明显

项目五实践:简易BI系统需要满足的功能

  • 数据集接入
  • 数据查询
  • 可视化展现
  • 如何通过别人的视角展现出自己表达的意图?

字节跳动大数据可视化的目标

大数据可视化正在做的事情是形成一个智能的可视化链路,来对智能可视化图表进行展现,智能可视化布局,自动配色,可视化的数据集推荐,自动配色,自动雕塑生成,自动动画等拱洞,智能套件做研发,在云端提取出来,作为智能可视化的研究重点。分为基础研发和产品的方向,在字节跳动内部的业务中能够接触到各种各样的基础研发和业务场景。

全景式概念输出

另外目前在大数据可视化领域项目的底层需要重要的可视化原理支撑,来进行一个全景式的概念支撑,怎样在实践中用正确的可视化原理,这是在业务场景中需要探讨的课题。

数据可视化基本流程

数据处理

对数据进行结构化操作,进行数据清洗,数据格式转换,异常值剔除等,得到一个纯净可用的数据集。

可视化设计与表达

基于数据特征选择合适的展现形式,并基于人体视觉识别规律使用视觉编码,来定义最终的可视化展现内容。

可视化渲染

这一步的目的是将输出的图形转化为图像的形式,直接呈现给观众。

可视化交互

可视化交互是基于图形接口借助交互方式,进一步对数据进行聚合,筛选,分面,使得用户能够对数据进行更深入的,多层面的了解。

个人思考总结

大数据可视化需要综合多方面的研究成果,基于人的心理学以及行为研究,从底层理论基础出发,借助mysql表格数据,图形学技术,图像渲染,使得需要呈现的数据直观,简洁,在第一时间表达数据背后隐藏的规律和意图。随着计算机技术的发展,动画也成为了一个重要的可视化手段,有助于人们理解深刻晦涩的生物原理等等。