译文:可视分析中的交互行为分类(三)

260 阅读12分钟

原⽂ 《Interactive Dynamics for Visual Analysis》~

Jeffffrey Heer, 斯坦福⼤学 Ben Shneiderman, ⻢⾥兰⼤学帕克分校

本文分《一》《二》 《三》三节,是国外介绍可视化系统中交互操作部分的权威综述。

本文定位在已经对可视化各种视图有充分的理解的基础上,有兴趣了解可视化图表的小伙伴,我推荐阅读出自同门的 A Tour Through the Visualization Zoo原⽂ 《Interactive Dynamics for Visual Analysis》

接《二》

过程、溯源

可视分析不只限于生成和操作可视化视图,它包括了一个迭代式的数据探索和解读的过程,因此具有这些功能的可视分析工具将更加广泛地被接受。分析工具应该把分析出处给保存下来。通过将历史动作和见解保存,使得今后可以再次查看和更新。文本的记录虽然是有益的,但是视觉概览更加简洁易懂。如果分析工具支持标注图案、异常值和兴趣区域,就能协助分析师记载分析过程中的洞察、疑问、假设。在互联的环境中,分析师应当能够分享结果、和同事讨论、在多个组内协调工作,从而完成长达数周、数月的工作。另外,分析工具可以给予新手以清晰的指导、给专家用户提供进度指示,以及引导用户浏览一个分析事件。

记录

当用可视化进行数据分析时,用户通常用迭代的方式遍历视图空间。探索性的分析通常带来一些假设,也导致了多轮的提问和回答过程。分析师可能会发现未预期的的问题,这些问题也许马上被调查,也许会在今后被重新访问。在分析过后,分析师或需要浏览、总结或交流他们的发现,通常通过报告或者演讲。

为了支持迭代式的分析,可视分析工具应该能记录交互历史。至少是, 能够提供“撤销”和“再做”。低阶的输入例如鼠标和键盘事件是容易捕捉的,而当用户要记录有语义的高阶行为时,历史功能就显得很重要了。通过对用户行为的建模(指的是视图指定、分类、过滤、缩放),更加丰富的记录将被建立并可视化出来。

通常分析行为的视觉表达包括表大时间的以及表达顺序的视图。如图14所述, 一个“连载式”视图追溯了商业运营数据可视分析中的步骤。视觉化的历史也可以揭示分支历史的层级形式。图15中,蛇形的样式(先从左到右,在从右到左)揭示了迭代式探索和分支、回溯的形式。这些与编组操作相关技巧减少了组织的混乱。

视觉历史同样支持广泛的交互。首先它提供了一个方便访问之前分析状态或重启未完成分析的机制。加入评论、标签、排名等元数据将促进后期的浏览和分享。交互式历史同样可以捕获一系列可重复的操作,将他们命名并保存成一个宏(用户将这些重复的操作保存成一个可以批量操作的程序)。

这种强有力的功能使得分析师在处理大量类似的数据时能够自动操作。历史能够促进分享:分析师可以导出分析步骤,方式从截图到互动式展示,再到发布到其他媒体上。同样它也是一种研究分析模型和分析过程的工具。

注释

交互式的可视化通常不但是探索数据的工具套件,同时也作为一个记录、组织、沟通洞见的方式。其中一种形式是在可视化历史上进行文字注释。更有表现力的注释将直接通过之前提到过的选择工具,直接和视图进行交互。分析师可能希望点选特定区域或项目,将他们与注释或其他视图相关联。

自由图形注释提供了一种有表现力的“点选”形式。在一堆项目中划出一个圈或在图表的峰值处画个箭头,将引导读者注意力。这些箭头或者圈的角度、颜色有时能够传达强调、情感印记。图16左边显示的是职场数据:用色彩编码的椭圆高显了一个在银行出纳职业上的性别反转。

左下的标注表达了对于有宗教信仰的工人奇怪比例的迷惑。尽管这种注释都是有较高表现力的,但他们缺乏明确的与底层数据的联结。用矢量图生成的自由注释可以在如缩放、平移等几何变换中保持下来,但是如果缺乏与底层的联结,它们可能在数据被聚合或者筛选后失去意义。

当系统能够辨识到一些操作,例如“选择”时,注释可以是理解数据的。如图16,在右侧顶部图上,选择查询器绑定了犯罪数据的注释。右侧底部展示了当数据编码发生变化时,注释的变化:选中的地理区域目前已转变为使用频率直方图滑块。这些“选中”可表现为一些被选中的项目或者声名性的查询,或者两者都有。“理解数据的”标注允许“点选”这样的意图在视图变换后仍然可以保持原先的状态,也就是说它能够跨越同一数据的不同可视化视图而保持存在。这是一种机器能够理解的标注,可以用来导出选择的数据,或者用于聚合来辨认高兴趣区域。

分享

对可视分析的研究通常聚焦在单个分析过程的感知和认知问题上。在实践中,分析往往是一个社会化的过程,包括了对结果的多重解读、讨论、散播。这个意图是很清楚的: 为了支持全生命周期的分析,分析系统要支持社会化的交互。至少是支持视图的输出或数据集的导出、分享和再访问。一个重要的能力是输出控制面板的分析设置,让其他分析师来看同样的可视化。 图17 展示了 Sense.us 的协作可视分析工具的视图分享、标注、讨论功能。这个系统由交互式可视化(a)、一套图形标注工具(b)、书签的缩略图(c)、添加文字评论用的输入框(d)、对当前视图文字评论(e)和可以随着可视化状态而自动更新的可分享的URL(f)。

一个简单有效的帮助方式来展开协作是通过app的书签进行分享。一个可视分析系统应该能够将其内部设置模式化并导出。不同于静态的截屏,书签允许分析师从上个人结束的的地方开始探索。视图分享通常采用URL或相似的意符来让协作者快速找到想要的视图。查看共同视图是协作者们讨论的前提,标注工具也可以为此提供更多协作的便利。一个关于视图分享的挑战是如何应对动态的数据。是应该提供当时数据的快照,还是最新的当前的数据,还是二者都要呢?

另外一种分享和传播方式是发布。一些商业化的工具 例如 Spotfire 和 Tableau,可以将可视化发布到web网页,通过这样来实现一些交互功能,例如选择、搜索、数据下钻。发布是非常重要的一种向大量读者传播的方式。 当然仅仅是发布并不能充分地让广大群体参与其中。如果将可视化嵌入到博客或论坛里,产生的沟通、讨论和传播的效率和效果将比一个单独的网站好。

其他协作方面的考虑取决于使用场景。要看协作者是同步还是异步的,在同一地理位置还是不同位置。每种构型的工作方式会导致不同的 分工、权限、出席指示和对活动的认知。

指导

数据探索的过程在一些传统领域是能够被较好地理解的。比如一个很简单的工作流程是移除不完整的数据项,然后排序、分类、选择高价值的项,然后进行报告输出。然而,分析师也需要创造一些新的策略,来引导新人、为专家用户提供过程指示。可视分析系统可以集成指引来引导分析师完成常规任务。

有些分析过程是清晰的线性过程,但是很多可视分析任务需要系统化且灵活的步骤,让分析师在踏上分析的长途中能够追踪到他们已经完成的任务。举个例子,“SocialAction”组织了一些列社交网络分析(通过节点排序、节点绘制、找寻社区),系统允许分析师选择性跳过一些步骤,同时对自己已经完成的步骤进行记录。图18中,左侧的看板展示了社交网络分析的通常步骤并提供了进度指示。相关地,专家会开发一些可视化工具给专业度不高的用户使用。这就如同电子数据表格里的宏一样,让专家把一些如会计和其他商业实践步骤给程序化。许多的研究都旨在定义一些有效的可视分析步骤,从而输出可复用的工作流程。

近些年,一些记者尝试用一些可交互的可视化图表来讲述故事。来自纽约时报、华盛顿邮报、卫报和其他新闻媒体的可视化通常会引导读者一步一步地用线性的方式进行阅读(辅以标注和文字解释)。在图19中,交互式图表运用了分段展示和标注,来引导读者阅读跨越数十年的预算预测。这些叙述框架不但提供了对关键数据的洞察,也提供了对分析功能的引导(通过给操作控件加动效)。这样,当读者打开它进行自由地探索时,就已经看到了针对控件功能性的演示。这些可视化的叙述展示了如何利用有向导的分析工具向大众传播一个基于数据的故事。

结论

我们希望这些分类和讨论能帮助各个战线上的可视分析师。对学生和进入领域的新手而言,这些分类提供了对可视分析交互方面问题的导向性的高阶介绍。我们鼓励

有兴趣的读者去查阅本文所引用的系统、书籍、参考文章来建立对这些问题更加深入的思考。

对于开发者来说,在开发新的分析工具时,这些分类可以当做一个checklist(核检表)来考虑。对研究者来说,这些分类帮助高显了值得进行更深入研究的关键领域,包括交互式说明、更紧密整合统计算法的可视化、充分利用数据语意的选择和标注技术、高效指导分析的途径。当然,在试图提供一个领域的抽象而宏观画面时,我们的分类方法或许是不完整的。在一些例子中,我们把一些紧密相关的要素分开讨论了。动态查询工具使得“数据选定”成为一种视图导航手段。“选择“对高效的标注来说也是很核心的环节。

其他例子中,我们选择性忽略了一些材料。首先,我们没有去深钻其实施细节。实现实时交互通常需要认真地考虑系统设计,特别是有大规模数据集时。当一些海量数据分析工具的如MapReduce实现了足够的吞吐量时,他们的高延迟和缺乏在线处理能力还是限制了流畅的交互体验。真实的交互分析的需求,向研发提出了一些重要的挑战:从低延时架构到智能取样、数据聚合方法。

我们的分类法在讨论前沿可视分析研究时或许也是有不足的。比如,何更好地整合自动的、半自动的统计学工具于可视化环境中一直是一个核心挑战。我们对于数据导出的讨论只是触及到表面。一个相关的考虑是数据整理任务: 重新格式化、清洗、整合数据集来进行可视分析。错误或不适当地将数据结构化,将转移熟练用户的注意力,也会给新手带来明显的麻烦。数据清洗中的细微差别需要基于专业知识的人工判断(这个异常值是错误,还是新的发现呢?)。数据整理是整合统计手段、可视化、交互技术的必要交互过程,这个话题值得更深入的讨论。

这些思考代表了当下活跃的研究方向。期待我们对这个领域的描述在未来能够得到发展。验证和发展这个框架是一个集体性的项目,可以通过分析师和实践者的反馈、批评、完善来进行下去。 我们接纳来自 可视化、统计、数据库、人机交互社区的观点和评论,并热切期望着这些让我们周围数据价值得以彰显的分析工具能够持续兴盛。

全文结束