这是我参与「第四届青训营 」笔记创作活动的第15天。
第二十节课「大数据可视化理论与案例分析」的内容主要包含 4 个方面:定义、原理、案例、学习。这篇文章主要介绍可视化设计、交互和动画。
可视化设计
认知(Cognition)与知觉(Perception)
关于知觉感知的研究总结,我们可以抽象人们识别可视化的三个步骤:
- Perception of raw visual signals,e.g. color, shape, etc. 原始信号感知
- Pattern recognition 模式识别
- Reasoning and Analysis 推理分析
可视化设计的目标就是要在以上三个步骤中,缩短人类的认知过程,达到准确高效的传递信息的目的。
- 编码:合理准确的可视化编码,可以提高人们在感知过程中各个步骤的速度和准确性。
- 格式塔理论(Gestalt Laws):较为系统的对人类如何发现图形元素之间的相关性进行了全面总结,被广泛的应用在了视觉设计当中,利用格式塔理论进行设计将有助于用户快速识别图形符号所构成的“群组模式”。
- 节省墨水:为了减少冗余可视化元素对读者的影响,在设计过程中,要尽量让每一个符号都有数据意义。
- 准确度:很多可视化设计会出现扭曲数据的情况,我们需要对夸张程度(或者准确程度)进行度量。
可视化编码
我们基于数据集类型来选取合适的可视化形式,接下来需要根据具体的数据条目(Item)的特性来确定合适的图元(Mark),最后根据性(Atrribute)来配置合适的视觉通道,对图元进行修饰。
Mark
根据数据条目的不同,将Mark分为两个类别:
Items / Nodes:points, lines, areas
Links:connection, containment
通道(Channels)
选取了 Mark 之后,需要进一步描述 Mark 的具体视觉特性,这些特性称之为视觉通道(Visual Channels)
视觉通道有很多,下图以6种通道和3种Mark相组合,可以很直观的体会二者之间的关系。
编码(Encode)
从数据到视觉通道的转换过程,被称之为视觉编码(Visual Encoding)。不同的数据属性需要用不同的通道来进行编码才能达到更好的效果。
编码有效性(Effectiveness)
由于人类感知系统的特点,在不同场景下需要设计不同的编码策略,来提升感知速度和准确性。
格式塔理论
格式塔针对人类对特定视觉模式的识别给了很好的分类,该理论同样适用于数据可视化设计。
- 邻近原则(proximity):空间中距离相近的元素有被看作一体的趋势。人们会很自然的根据距离来对视觉对象进行分组。
- 相似原则(similarity):刺激物的形状、大小、颜色、强度等物理属性方面比较相似时,这些刺激物就容易被组织起来而构成一个整体。
- 连通性原则(element connectedness):如果一些元素与其他元素相连时,我们认为这些元素是统一体。
- 连续性原则(good continuation):如果一个图形的某些部分可以被看作是连接在一起的,那么这些部分就相对容易被我们视为一个整体。
- 封闭的原则(closure):有些图形是一个没有闭合的残缺的图形,但主体有一种使其闭合的倾向。
- 共同命运原则(common fate):如果一个对象中的一部分都向共同的方向去运动,那这些共同移动的部分就易被感知为一个整体。
交互(Interaction)
静态的数据展示并不能满足用户需求,很多时候我们需要提供交互形式,使得用户可以对数据进行多维度的探索。
《Visualization Analysis & Design》一书对交互进行了分类,分为以下9种
- Change 改变
- Juxtapose 并列
- Filter 过滤
- Select 选择
- Partition 拆分
- Aggregate 聚合
- Navigate 导航
- Superimpose 叠加
- Embed 镶嵌
动画(Animation)
动画在可视化作品中的作用受到的关注越来越多,目前人们比较关注的作用有如下几个方面:
- 体现数据变化过程
- 引导观众的注意力
- 增强美观度
图元动画
- 图元进场:缩放、渐变、生长、飞入……
- 图元退场:渐变、模糊……
- 图元更新:缩放、变形、融合/拆分、颜色、位移、旋转、文本更新、数字更新……
全局动画
- 遮罩、镜头变换、鱼眼变形、缩放、展开、闪烁、渐变、粒子、波纹、流光、路径
个人总结
了解了数据可视化的可视化设计(包括认知与知觉、可视化编码、格式塔理论)、交互和动画。