原⽂ 《Interactive Dynamics for Visual Analysis》
Jeffffrey Heer, 斯坦福⼤学 Ben Shneiderman, ⻢⾥兰⼤学帕克分校
本文分《一》《二》 《三》三节,是国外介绍可视化系统中交互操作部分的权威综述。
本文定位在已经对可视化各种视图有充分的理解的基础上,有兴趣了解可视化图表的小伙伴,我推荐阅读出自同门的 A Tour Through the Visualization Zoo原⽂ 《Interactive Dynamics for Visual Analysis》
接《一》
视图操作
一旦分析师通过数据和视图选定操作创建了可视化,它们应当能够操作视图来高亮一些图案、查验假设、钻研细节。分析师必须能够选择项目或数据区域来高显、过滤或处理它们。大的信息空间可能要求分析师滑动、平移、缩放以及通过其他导航形式来仔细审视高阶的图形和粒度小的细节。多重的、互相联动的可视化通常能为多维数据分析带来更清晰的洞察。分析工具必须协调各个视图,使得诸如选择、过滤等操作能在每个视图上起作用,还必须能够组织好展示结果的仪表板和工作空间。
选择
选中一个项目或兴趣区域在日常的交流中是常见的,因为它表明了对话或行动的主题和内容。在物理世界里,人们通过姿势、目光、言语、凸显一个项目(事件)。例如手势可以传达角度(有方向的平掌)、高度(水平的平掌)、间隔(拇指和食指做C型)、分组(圈一个区域)、力度(使拳头加速)。在可视分析中,“提及”或“选择”很重要,它们通过一些有限的行为来实现,例如点击、框选兴趣项目等。
常用的选择方式在可视化中包括了鼠标悬停、鼠标点击、区域框选(矩形、椭圆区域或者任意形式的索套)、区域光标(例如气泡光标。气泡光标是用来选择距离鼠标指针最近项目的工具)。
这些“选择”操作通常决定了哪些是将要被处理的项目,使其被高显、注释、过滤或显示需要的细节。需要注意的是,交互式的选择和过滤是有密切联系的:选择可以用来确定哪些项目将要被移出屏幕。当考虑采行哪一种“选择”方式时,操作情景也是必须考虑的因素。例如用鼠标悬停显示细节的方式,在搭载触摸屏的手机、平板上不太适用。
“选择”也会因为其表现力而变化多样。多数界面支持选择项目集合。尽管这种方式是容易实现的,但这并不能支持分析师去应用高级别的查询(筛选)标准。一种更强大的、但也更复杂的方式是将“选择”作为数据的查询一环。查询架构可以增加可视化应用的表现力。例如,在一个图表中的框选操作,可以是不直接选中所框选项目,而是通过所画的矩形框,确定要查询数据的X、Y轴坐标范围。查询所用的标准可以保存下来并应用在动态数据中(更新了的项目或许在或许不在设定范围内)或用于其他完全不同的可视化。例如股价的变化(在 TimeSearcher,如图6),和在平行坐标系中显示属性范围(如图7)。 在图6中一个角度选择工具指定了一个目标的斜率和其容限,因而查询时间范围内的有相似斜率的时间线都被选择了出来。被着色的区域显示了对最小值和最大值的包络。 这个小工具可以直接在可视化上进行操作:把它从左拽到右,可互动地查询其他时间窗口。图7中平行坐标系将多维数据通过线段形式在多个坐标轴上展现。分析师通过沿着坐标轴拖拽,来建立选择范围,高显所选择的项目(比如质量轻且里程高的汽车)。
设计一种具有表现力的选择方式一直是一个热门的研究领域。举个例子,研究者提出在一个时序可视化上匹配鼠标动作的方法,用来选择一些感觉上很显著的数据,像峰值、谷底、斜坡(如图8),或者来查询随时间变化的复杂形式。初始的选择可以作为更复杂选择的起点,正如分析师可能先选了一个代表性的项目,然后基于其属性构建了一个查询条件(例如选择所有和这个项目一样的蓝色项目)。当然,选择不必限于鼠标键盘的操作:输入模式例如触摸、手势、对话都有可能产生新的选择模式。
导航
如何进行导航取决于分析师在信息空间里的起始位置。有一种导航模式产生于广泛引述的信息检索箴言: 先总览,然后缩放、筛选,最后看需要的细节。分析师可能首先广泛的浏览数据,包括找出显著的群组、异常值、潜在的数据质量问题。这些指向行为通常伴随着对数据子集的更详尽的考察。一个常见的例子是电子地图:在全览时展示全部领土,之后在兴趣区域进行放大。图4讲述的是空间和时间维度的犯罪活动可视化。它展示了2011年10月最后一周黑天时间的犯罪事件。动态查询工具允许从一天中的时间(左)、时间范围(底)、犯罪类型(右)中进行筛选。平移(拖拽)和缩放控件实现了界面导航。当分析师放大时,圆形犯罪标志转而显示更多细节,这是一种语义缩放的形式。
当然,一开始就进行总览,并不总是适用的。一个对即将发生的审判而进行的法律分析的研究者,可能会放弃对整个美国历史案件审判的查询,转而去分析与当前案件相关的审判案例。他会使用关键词搜索,并把考察范围拓展到其他引用这些审判结果的案例。这样的模式可以总结为:先搜索,然后显示内容,在根据需要进行扩展。在任何时候,可视化都将作为信息空间的观察窗,分析师通常会利用它们进行导航。常见的例子包含了通过滑动条或鼠标拖拽进行的滑动或平移、用缩放滑杆实现不同层级视图的切换,以及用转盘进行旋转。缩放并不需要严格按照几何上的含义:语义缩放能够在调整放大级别时,让分析师看到不同的的信息量。图9中的日历中,随着分析师从月到日到小时的导航过程,被选择区域也扩大了,语义缩放使它展示了更多的内容。另外,动态查询工具,如散点图x、y轴的范围滑块
可以筛选可见的数据范围,因此提供了图表上的缩放。为了避免过多的导航操作,研究者们开发了多种焦点+上下文的的途径。这些双焦的显示方式,提供了对高兴趣区域的细节显示,同时保留了周边上下文信息帮助读者定位。第二种主要思路是用总览-细节的显示方式。举个例子,一个地理信息的可视化可能包含了大比例尺地图和小比例尺视图(带有矩形框显示大比例尺视图范围在整个信息空间里的位置)。在这种情况下,细节视图提供了聚焦,而总览视图提供了上下文情境。当放大级别较高时,中间级别的总览视图也是有所帮助的。有一种方式是通过扭曲、放大等技术,使整个屏幕变形,上下文区域变小。苹果mac os上的底栏的鱼眼形变就是这样来显示鼠标聚焦区域附近的应用的。更复杂的方法是在多维数据展示中运用折叠等形变。虽然在视觉上是有吸引力的,但它们在现实中的价值还有待证明:用户在这些非线性的形变中会迷失方向,显示了其相对于简单形变(比如缩放)的收益并不明显。
除了操控屏幕空间,焦点+上下文的方式可以直接应用于数据本身。其目的是辨认出哪些是当前高关注的数据(焦点),哪些是高重要性数据(不论是否是当前焦点),哪些是可以安全地从视图中移除的数据。DOI(兴趣度)基于对信息内容的整体重要性(比如有优先级的顶层类别、高度向心的节点)和当前兴趣(如被鼠标点击、检索或与其他兴趣项目相邻)进行打分。DOI分数的分布可以选择性地控制项目的可视性,基于现有视图尺寸和上下文的互动,如图10。
当分析师点击或寻找不同的项目,DOI分数动态地更新以便揭示未被看见的相关数据或者隐藏不相关的细节。一个分析师当前兴趣的模型,是通过过滤屏幕信息,留下那些相关度更高的信息来实现的,低可信度的信息将被省略,但仍然是可以触达的。
可视化可以为分析师的导航决策(去哪,怎么去)提供线索。视图操作的控件通常是不可见的,如缩放、通过鼠标平移。改进过的策略促进了分析师来发现它们:在图例或其他地方提供了可视的设置项,如在滚动条的位置提供了反馈。一个重要的挑战是显示被选择的项,即使它们未在视图中显示。举个例子,不在屏幕上的文本检索的结果可能通过标志形式展示在滚动条上,或在屏幕周边显示。
视图协同
许多问题的分析需要多视图的协同,让分析师从各个角度洞察数据。一个公共政策分析师研究受教育程度时,可能会用到人群年龄的条形图、位置地图、和展示教育-收入的散点图。
通过在一个视图中选取一个或一组项目,分析师将看到这样项目在其他视图中对应的项也被高亮显示(选中)。这种来探索多变量数据的有力方式,同样支持下钻到从属的组别、设置标签、导出选择项目。多视图显示可以促进对比,例如Edward Tufte提倡用小的多屏幕显示:他们是许多空间上相近的可视化图, 通常采用同样的度量和范围。 在图11中,这些小的多屏,也叫格子图,能够快速通过不同的数据维度和时间切片进行比较。这个可视化描述的是明尼苏达州经济部门提供的就业信息。这些重复的图表支持了在多个部门之间的对比。当然,将全部数据放在一个图里将会显得拥挤并使得个体的趋势变得模糊不清。
另外,多视图显示可以应用于多种可视化类型。例如频率直方图、散点图、地图、网络关系图,来展示多维数据集的不同映射方法。在图12中,分析师构建复杂拼接的互动表格、图形、地图来分析密歇根州选举结果。图中的注释揭示了被选择的数据是怎样在多个可视化视图中进行关联的。附带的图例、直方图的滑块、带有高亮标志的滚动条支持提供数据的多维视角。
当可视化用来分享时,自动生成的图例或数轴对于解释表意来说是很重要的。图例和数轴同样可以作为控制台来更换配色、属性标记、变量范围或来源信息。
多重视图显示也能够实现跨视图的交互式探索。刷动和链接是实现在一个视图中选择项目、在其他视图中也高显这个项目的实现方式。图13中,棒球项目分析师选择了一个图中的一项,这个项在其他视图中的对应项也被高显出来了。在左边,选择高收入玩家揭示了这个群体对职龄和守卫能力的低依赖,以及与击球表现的关联。在右边,选择那些助攻多于接杀的玩家,显示了其对位置的强依赖。可见每个可视化视图都是揭示整个数据模式的输入通道。关联式的选择支持多维度的推理,通过让分析师看到一个视图中的模式是如何投射到其他视图。分析师可能通过多种方式来协调视图:在一个视图中选择项来高显该项在其他视图的对应项,或者是提供筛选标准来过滤其他屏幕的信息。关联式导航也为视图协调提供了另外的形式,当一个视图进行缩放、平移时,其他视图也发生对应操作。尽管比较多个可视化要求观察者要协调好注意力,并在心理上整合各个视图的图案,这种方式还是比在单一视图上加载多个维度的数据要高效。
关于分析师如何构建多视图显示并指定协作方式(高亮、筛选等)的研究为如何构建更高效的工具提供了理解。除此之外,如果设计师能保证多视图显示能够易于理解,分析师就更容易做出更有说服力的分析产出。新手,甚或是刚刚茶歇回来的老练的分析师,或许都会被这些复杂的视图和它们之间协同迷惑住。可视分析系统如果能提供协同设置的入口,以及调用之前构建历史的功能,便可增强其可理解性。
页面组织
当分析师利用多重视图时,它们面临着相应的挑战是如何管理这一些可视化。传统基于视窗的界面中,分析师也许会关闭、最大化、排布不同元件的布局。纯手动窗口操作是乏味的,设计得好的可视分析工具简化了视图、图例、交互控件的组织。例如,一个人力资源的数据库可能会展示散点图来描述年薪和工作经验,外加一张条形图来展示10个年龄段的人数,以及一个有7个公司网站的树形图, 每个都有10-30个职位名称。这三个可视化可能给予散点图一个大空间,而数形图和条形图则放在右侧上下堆叠在一起。一个有滑动条、复选框、单选框、搜索框的控制面板在右侧更远的地方,还有一个细节窗口和注释框在底部。这些平铺方式允许分析师在足够大的屏幕上一次看清所有信息和选择器,减少令人分神的滚动或窗口操作,让他们精力集中在提取、产出观点结论。在窗口之间的协同意味着滑动、多选之类的操作,会导致各个视图的数据更新,使得可以快速的找寻在特定网站上的或特定职位的应聘者。
典型的系统允许分析师添加视图,例如在窗口里添加第二个散点图,这种方式是在已经有的窗口上的适中调整。另一种方式是加一个新的tab来承载第二个散点图,这样一来分析师就可以在在第一个和第二个窗口切换。他们的共同的特点是加入网格化的视图单元,使得多个可视化可以一次创建出来,例如创建7个单独的直方图来展示每个企业网站分别的年龄分布数据。
更先进的系统或许借助自动化来辅助这一视图组织过程,得多窗口可以成组地打开或者关闭,以及按顺序编排它们。有用的方式包括了标准的散点图矩阵或着用户自行生成的兴趣视图。理想的方式是自动调整视图尺寸,使相关联的视图排布在空间上接近。
由于大屏和多视图显示越来越普及,布局组织已经成为构建高效用户体验的决定性因素之一。同样地,在平板电脑和智能手机上展示可视化的需求也将催生紧凑的、可以通过简单手势来重构的排版组织形式。缩放、平移、点击、排序策略也将改善分析师的体验,并更高效地进行表达。
本篇完