本文作者:布鲁托
高维数据是指每个数据对象具有两个或两个以上独立或相关属性的数据。涉及文本数据,时序数据,空间数据等等。
采样
采样是一种常用的对数据精简的方法,对于可视化角度来看,最方便的莫过于刷选操作。
沿着黄色参考线进行采样,每一个小矩形即是一次采样。
采样得到一组数据后,数据量大大减少,但是数据维度依然没有改变。
属性签名
在得到一组采样的数据后,想要获得各个维度之间是否有关联、关联程度,原文作者提出了用一组折线图来展示所有的数据维度,选中参考折线图后,以欧式距离对这些折线图排序,排序后与参考折线图最相似的折线图离得最近,这种方法给了用户以较简单的展现方式表达数据维度之间可能存在的相关性。
带有蓝色边框的折线图即用户选中的参考折线图。
排序后的折线图,显而易见所选的与参考维度最相似的数据维度。
原文作者是基于地理数据提出的方法,非地理数据似乎也可以应用该方法,将采样的主视图的地图替换成其他图标未尝不可,例如时序数据就可以用柱状图作为主视图,对其采样即可,仍然可以得到以上的折线图组。
本文是在校期间帮老师做项目学到的一部分知识,趁着完全遗忘之前写下来。
参考文章:
-
Attribute Signatures: Dynamic Visual Summaries for Analyzing Multivariate Geographical Data