如何使用Power BI进行流程挖掘

1,347 阅读7分钟

在这篇文章中,我们将学习如何用Power BI进行流程挖掘。

简介

数据颗粒度主要可以分为两类--交易型数据和分析型数据。事务性数据通常是最低级别的颗粒度,而分析性数据通常被卷起来或聚合起来,使其达到更高的颗粒度水平。汇总的或分析性的数据可以用于仪表盘、下钻或钻透式的分析,以执行根本原因分析、监测关键绩效指标和其他类似的目的。对于像数据挖掘、机器学习或人工智能这样的分析,一般来说,数据是从事务性存储库中提取的,用于抽样或通过挖掘得出推断。当人们想在同一个系统中采用数据挖掘和仪表盘时,这两派数据的挑战就来了,因为一般来说,处理或消费不同颗粒度的数据的系统是非常不同的。如果采用两种不同类型的系统来实现每种类型的数据处理,使数据消费者能够执行数据挖掘和仪表盘是一项非常具有挑战性的任务。数据工程的一个现代趋势是使终端用户能够使用R和Python等数据框架以及各种本地和第三方的智能可视化工具来执行各种数据处理相关的任务,这些工具嵌入了数据分析所需的功能,并为终端用户的操作提供了标准接口。

不断产生和收集的最大类别的数据之一是日志。日志的种类繁多,取决于生成日志的来源。操作日志如票据或事件相关的日志构成了数据日志的一个重要组成部分。数据科学的一个特定分支,致力于分析操作日志,并从这些数据中生成操作情报,这被称为流程挖掘。企业采用复杂的系统来建立大规模的流程挖掘系统。为了以自我服务的方式为终端用户执行初步的流程挖掘探索,报告工具可以作为一个起点,是最好的途径之一。Power BI桌面可以作为一个起点来执行流程挖掘,根据流程挖掘要求的复杂性和深度,可以选择继续使用Power BI或采用其他系统。

流程挖掘

由于我们将使用Power BI进行流程挖掘,因此假定人们已经在自己的机器上安装了Power BI Desktop。Power BI提供了开箱即用的原生可视化功能,并支持导入第三方可视化功能。执行流程可视化的一种方式是在Power BI之外分析和准备数据,并使用它来报告预处理的数据,而执行流程挖掘的另一种方式是使用Power BI本身的智能可视化,可以在一定程度上执行流程挖掘所需的数据分析。在这篇文章中,我们将使用第二种方法,我们将使用一个第三方的可视化,它可以从Power BI的可视化库中免费获得。这个可视化供应商的名字是ProcessM,可视化的名字是Blpm和PmBI,这两个名字都代表流程挖掘商业智能。可能还有很多其他的供应商和这样的可视化软件可以用于流程挖掘,我们将使用这个特定的可视化软件进行讨论,以实际了解流程挖掘对那些刚接触流程挖掘的人来说是什么样子。人们可以从这里导航到Blpm可视化。使用这个可视化的第一步是下载可视化控件本身,也可以选择下载与之配套的样本文件。正如在对可视化的描述中提到的,这个可视化在内部创建了一个可能类似于典型的在线分析处理(OLAP)立方体的结构,然后利用这些数据,以力导流图的形式展示从数据中挖掘出来的智能。

Blpm flow graph

打开我们从这个可视化的产品页面下载的报告样本文件。导航到报告的模型视图,它看起来如下所示。两个较小的表只是用于过滤,核心的表是修复实例表。这个表中的字段给了我们一个线索,即从这个表所持有的票据数据中可能进入挖掘过程结构的典型字段。

Data Model

切换到数据视图,它将显示此表的实际数据。浏览和滚动这个表的记录,我们就能发现这个表有很多事件,即与票据有关的数据。提出票据的客户是由名为Customer_Cluster的字段来分类的。生命周期字段捕捉到事件的阶段。

Process Data

虽然组织有一个规定的流程,但在一个多方环境中,人们想根据操作数据分析或了解所遵循的流程,必须执行流程挖掘。为了使这个可视化推断出的情报可视化,我们现在可以导航到这个样本报告的报告视图。这个可视化依赖于R在系统中的安装和对Power BI的访问。假设已经安装了R,当我们打开报告视图时,它会提示我们安装某个R包并为这个报告启用脚本。查看可视化的先决条件,点击安装按钮,允许安装包。

Required R Packages

一旦软件包安装完毕,我们将能够查看从我们先前看到的操作数据中创建的过程的力导向图。图上显示的每个实体都显示了一个过程的阶段,以及在该过程阶段发现的事件数量。一个实体与另一个实体的关联以及连接两个实体的箭头所显示的关联权重是这个可视化的实际推断,这对我们来说比较容易,如果是手工操作的话,会很费时间。为了理解这个可视化是如何推断出实体和连接它们的路径的,可以考虑看看被用来渲染这个可视化的字段,它将为推动这个过程可视化的渲染的因素提供更多的见解。

Process Graph

在一个非常高层次的探索目的的基本层面上,这个可视化可以被认为是一个很好的流程挖掘的起点。在实际的真实场景中,人们可能需要更复杂的功能,在那里,可视化会衍生出更多的智能,并解释导致从操作数据中提取的过程图或流程的因素。同一供应商提供了另一种可视化的流程挖掘,称为PmBI,如下图所示。从这个可视化的描述中,我们可以很容易地看出,这是一个比前一个可视化更丰富的功能。

PmBI Process Mining

如果我们在这个可视化的样本Power BI报告文件中探索用于这个可视化的数据,我们会发现它使用的数据与我们在之前的可视化中使用的数据相同,如下图所示。

Sample Data

在这里,我们可以看到使用这个可视化创建的仪表盘,如下图所示,一个柱状图和一个漏斗图。在这里,数据是以一种更有组织的方式显示的,而且该可视化提供了许多自定义的功能。

Process Mining Output

如果我们把鼠标指针悬停在连接过程中不同步骤的任何一条边上,我们将能够看到更详细的信息,如下图所示。

Tooltip

考虑通过点击这个可视化的菜单选项以及这个可视化的格式化选项来探索这个可视化的功能,以充分挖掘这个可视化为流程挖掘提供的能力潜力。

总结

在这篇文章中,我们学习了流程挖掘的一些基础知识,以及在Power BI中可以使用流程挖掘的案例。我们了解了流程挖掘类别中的一个可视化工具,并通过下载可视化工具和样本报告文件,分析数据和此类可视化工具的输出,学习了了解此类可视化工具的简单方法。