数据可视化三部曲之起舞于字节| 青训营笔记

235 阅读4分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 14 天

数据可视化的部分我会分三章讲述,这是一个精彩的世界,跟随我在数据字节上起舞吧

何为数据可视化

科学可视化(Scientific Visualization)、 信息可视化(Information Visualization)和可视分析学(Visual Analytics)三个学科方向通常被看成可视化的三个主要分支。而将这三个分支整合在一起形成的新学科 “数据可视化”,这是可视化研究领域的新起点。 ——《数据可视化》

1676264360900.png

为什么需要数据可视化

人类利用视觉获取的信息量,远远超出其他器官
人类的眼睛是一对高带宽巨量视觉信号输入的并行处理器,拥有超强模式识别能力,配合超过 50% 功能用于视觉感知相关处理的大脑,使得人类通过视觉获取数据比任何其他形式的获取方式更好,大量视觉信息在潜意识阶段就被处理完成,人类对图像的处理速度比文本快 6 万倍。
数据可视化正是利用人类天生技能来增强数据处理和组织效率。

可视化可以帮助我们处理更加复杂的信息并增强记忆
大多数人对统计数据了解甚少,基本统计方法(平均值、中位数、范围等)并不符合人类的认知天性。 最著名的一个例子是 Anscombe 的四重奏,根据统计方法看数据很难看出规律,但一可视化出来,规律就非常清楚。

1676264417751.png

可视化的过程

可视化的整个过程需要具有不同技能和专业领域知识的人。数据工人努力收集数据并完成分析。数学家和统计学家理解可视化设计原则,并用这些原则完成数据交流。设计师或艺术家在一些情况下,称为开发先驱者具备可视化所需的技能,而业务分析员在寻找顾客行为模式、离群点或突发趋势等。然而,这往往从获取或收集数据开始,步骤如下:

获得或收集数据 这些数据来自外部资源、网站或磁盘上的文件

解析和过滤数据 用编程方法进行解析、清洗和减少数据

分析和提炼数据 删除噪音和一些不必要的维度,发现模式

呈现和交互 用更容易得到和理解的方法展示数据

处理过程中需要做的工作因不同问题而异。在一些情况下,分析比过滤数据要做更多工作。

总结

数据图表主要作用是传递信息,不要用它们选技巧,不要追求过分漂亮
不要试图在一张图中表达所有的信息,不要让图表太沉重,适得其反
数据可视化是以业务逻辑为主线串联,不要随意堆砌图表
避免过度开发,什么数据都想展现,数据太多就选择最核心的数据指标、和正常偏差大的、能支持分析结论的
不要试图掩盖问题,回避“不良结论”,真实反映业务,暴露问题
慎用动态图表,尤其一个页面多个动态图表
避免过度设计,一般不适用3D、阴影,合理运用色彩同样能让图表显示的很高级
数据产品的表现层可算作是大型的数据可视化项目,是产品设计方法和可视化方法的结合,分别掌握的产品设计方法和可视化方法然后综合运用不是什么难事 明确图表想说明什么业务问题、业务逻辑 、数据分析结论
确定关系和对比的维度,是时间趋势、比较,还是分布关系,对比维度(时间: 同比 环比 定基)、空间(华南 华北 区域与全国)、特定标准(实际和计划)
根据对比关系,数据维度,数据分类多少选择合理的图表,每一种图表都有它自身的优点和局限性
生成图表并验证是否正确,是否和预期一致
细节调整,坐标轴(刻度标记类型、间隙、刻度标签位置、数据类型、小数位、是否千分位)、颜色取值、图例位置、图上标签、图表标题等细节
在恰当处备注文字说明,例如标注特殊事件