在这篇文章中,我们将使用Power BI Desktop来分析数据集中的关键影响者,并学习如何使用相应的可视化。
简介
数据量可以在广度和深度方面增长。当数据在深度上增长时,可能意味着数据集包含了非常巨大的记录数量,但数据集中的属性可能是有限的或在正常范围内。当数据在广度上增长时,可能意味着数据集会有非常多的属性,但数据集中的记录数可能在正常范围内。一个在广度上很庞大的数据集会带来一个独特的挑战。某些类型的分析,如根本原因分析、机器学习的探索性数据分析和类似形式的分析变得具有挑战性,因为很难确定哪些属性会影响有关的目标属性。例如,要从大量的属性中找出影响客户评级的因素或属性,可能需要考虑许多排列组合,并将数据范围扩大到所需的程度。人工操作可能是一个极其乏味的过程,而且最终用户一般不具备探索性数据分析等编程方法所需的技能或资源。像Power BI等报告工具提供了自助服务选项和可视化,以分析数据中的影响者。
从Power BI中的数据生成叙述
假设最新版本的Power BI桌面已经安装在开发机器上,并且用户可以访问。为了模拟大量的数据集,我们至少需要一个小的数据模型,其中有不同数量的属性。我们可以在这个练习中使用任何可用的数据集,所以人们可以使用他们已经有的数据。另外,人们也可以通过使用获取数据菜单选项将数据导入我们将要创建的Power BI报告中。在我们的案例中,我将使用微软提供的客户评级和反馈数据模型样本。该数据模型连同数据已经被导入到Power BI报告中。当我们点击数据模型视图时,它看起来如下所示。
如下图所示,这里我们有一组相关的表,即客户、地理、角色、订阅、公司、设备和支持票。这些数据是关于客户及其相关的细节,如地理、订阅、他们使用的设备,以及他们为他们可能使用的不同服务提供的评级。这里的目的是分析影响客户所提供的评级的因素。这种分析与典型的报告不同,在这种报告中,我们会报告交易或汇总的数据,然后从不同的角度进行分析,如分布、趋势、比较值等方面。在这个分析中,我们将试图找到影响客户评级的关键影响因素。
Power BI桌面最近引入了一个名为关键影响者的智能视觉。这个项目可以在插入菜单选项中找到,如下图所示。一旦我们有了数据以及报告中的模型,我们就可以点击这个菜单项,将关键影响者的智能视觉添加到报告中。

一旦Key Influencers被添加到Power BI报告中,它将如下图所示。默认情况下,该视觉是空的。要使这个视觉效果好,需要的关键区域是解释部分和分析部分。**分析 "**部分用于指向我们打算分析的变量或属性。Explain By部分用来指向可能影响Analyze部分中指定的属性的变量或属性。
为了开始填充这个视觉,我们可以展开字段部分,并开始将正确的属性分配给正确的部分。由于这是定制的门票和评级数据,我们打算分析导致客户评级高或低的因素。在这种数据集中,最自然的分析属性是评级属性。在 "分析 "部分拖放评级属性,如下图所示。
可视化还不会呈现,因为我们还没有指定要用来确定是否影响评级属性的属性。让我们拖放那些看起来足以影响评级属性的相关属性,如地区、角色、订阅、公司规模、主题等。一旦我们拖放了这些属性,可视化就会填充数据以及相应的分析,如下图所示。视觉中会有两个部分被创建--关键影响者和顶级细分市场。默认情况下,"关键影响者 "部分将成为焦点。这一部分将被垂直分为两个部分--一个部分将显示影响属性与影响属性的具体数值以及影响程度。另一部分将显示所选属性的价值分割或分布。在下面的部分中,机关中的角色属性被选中,它似乎对高客户评价的贡献是1.2倍。角色字段中的主要数值显示在右边,它们是出版商、管理员和消费者。图表上的红色虚线显示了高于平均值的数值。
默认情况下,分析是针对目标属性中的一个值显示的。在我们的案例中,上面显示的分析是针对评级属性的值为高时的分析。评级至少会有两个值,即高和低。如果我们点击 "影响评级的因素 "文本附近的下拉菜单,它将显示不同的值,如下图所示。
让我们选择 "低 "这个值来分析是什么因素导致了低评价。一旦选择,分析结果将如下图所示。如果我们只是看一眼上面和下面显示的数据,很明显,角色是影响评级的一个非常重要的属性,客户似乎提供了更多的低评级,而出版商似乎提供了更多的高评级。而且,角色属性对评分的影响程度,在低评分的情况下比高评分的情况下要高。
如果我们点击 "顶级细分市场"标签,它将显示细分市场,即它所确定的导致或促成特定评分值的类别。这里显示,它检测到七个细分市场,并对它们进行了评级。这里的视觉效果只是显示了细分市场的等级、评级较低时的百分比和人口,即属于这个细分市场的相对数据集大小。
从这个视觉上看,段的细节不是很清楚。我们可以点击任何一个气泡来探索用来定义这个细分市场的标准。一旦我们点击任何分段,细节就会出现,如下图所示。细节部分的左窗格显示,用于定义段1的标准是当org中的角色是非出版商,订阅类型是首要的,而主题是安全。
如下图所示,通过扩展 "了解更多关于此段 "部分,可以探索关于此段的很多细节。
这样一来,使用关键影响者智能视觉,就可以加快分析影响目标属性的关键因素。
总结
在这篇文章中,我们了解了关键影响者分析以及如何在Power BI桌面工具中使用这一智能视觉。我们从一个样本数据集开始,确定了一个要分析的属性,然后分析了可能是目标属性的关键影响因素的属性。








