如何在Power BI中生成智能叙述

1,992 阅读7分钟

在这篇文章中,我们将学习如何在Power BI中使用智能叙述来生成文本叙述,以总结报告中呈现的数据的关键亮点。

简介

数据可以是不同种类的,如文本数据、涉及数字的财务数据、与地理信息相关的空间数据,以及其他数十种至数百种数据。特定类型的数据被托管在特定目的的数据库和数据对象中,因此可以根据数据的性质进行管理。与特定类型的数据存储库或特定类型的数据对象的方法不同,数据消费实践几乎以相反的方式运作。事务性报告通常在任何给定的报告中种类较少,因为数据的范围和背景都是有限的。分析性报告和仪表盘通常会呈现大量的数据,如关键影响因素、关键绩效指标(KPI)、地图上呈现的空间数据、记分卡、趋势线、图表、图形、网格和许多其他形式的数据表现。虽然在仪表盘上报告了大量不同的数据,但对于终端用户来说,仅仅通过视觉上瞥一眼仪表盘,就能解释报告中的关键亮点,这变得很乏味。

为了让终端用户更容易理解,这项工作可以由报告或业务分析员来完成,他们可以预先分析报告,手动形成文字叙述,总结报告中的关键亮点。虽然这解决了有关的挑战,但它开启了一种可能性,即分析师的偏见被引入报告中,而终端用户可能同意或不同意这种叙述。一些系统通过采用复杂的机器学习/自然语言处理/其他基于人工智能的机制来解决这个问题,自动生成智能文本叙述,总结数据的关键亮点。虽然这种方法可行,但它需要大量的资源和难以找到的技能,这超出了普通终端用户的范围,他们可能想以自助方式使用报告工具并建立一个仪表板。

现代报告解决方案,如Tableau、AWS QuickSight、Microsoft Power BI,以及其他类似的解决方案,已经提供了一个功能,即在报告工具中使用内置的AI/ML生成关键的见解,使最终用户能够提取见解,并使报告开发人员能够拥有一个智能视觉,根据数据的变化自动更新见解。

在Power BI中从数据中生成叙述词

我们需要有一个报告,在报告中呈现各种数据和视觉效果,这样就可以模拟出通常在真实世界场景中的报告的复杂性。可以使用任何现有的Power BI报告,也可以使用Power BI中的一些样本报告。假设你的机器上已经安装了Power BI Desktop,并且在Power BI Desktop中已经有了一个合理的复杂的Power BI报告,并填充了足够的数据和可视化内容。下面显示的是这样一个报告的例子。

Power BI Report

让我们手动分析一下这个仪表盘,得出一些我们可以从这个仪表盘中直观地得到的见解。这个仪表盘有四个图表--柱状图、线形图、热力图和空间图。在所有这些图表中,最容易解释的是柱状图。如果我们将鼠标指针悬停在较高的柱状图上,我们可以看到最后一个柱状图是最高的。当我们将鼠标悬停时,我们可以看到月份和字段以及它的值。从图表中可以看出,11月的收入是最高的,显示在RevenueTY字段中。与图表中显示的任何其他月份相比,要弄清这个百分比有多高并不容易。

Column Charts in Power BI

另一个分类显示很多细节的图表是折线图。如果我们将鼠标悬停在这个图表上,它将显示细节和数值。在这个图表中,如下图所示,最后一个月显示了不同人员产生的收入之间的很多差异。这由 "收入变化和预算 "字段表示。这也很难直观地在不同月份和人员之间进行比较分析。

Line Charts in Power BI

这两张图表的其余部分并不像其余两张图表那样代表或囊括那么多的细节。比方说,我们打算在不手动做任何细节分析的情况下,给它添加一些文字叙述。这时,就可以在这个报告中添加智能叙述的视觉效果了。现在,我们只是想探索一下根据报告中的数据生成的叙述,抓住一些快速推导的机会,这个视觉可以使用其内置的智能。使用任何可视化工具创建叙述的一个简单方法是,右击并从上下文菜单中选择总结选项,如下图所示。

Summarize Option

一旦我们点击这个选项,它就会创建一个新的方框,里面有一个总结性的叙述,如下图所示。这里的叙述有两个陈述。第一个陈述是:"3月份的收入与预算的比率最高,为8.30%,比2月份高277.25%,2月份的收入与预算的比率最低,为-4.68%"。我们在分析这个图表时,无法进行这种比较分析,相反,似乎11月的差异最大。

第二个叙述性陈述是 "在所有11个月中,收入与预算的差额%从-4.68%到8.30%不等"。同样,这也是另一个比较分析的例子,仅仅瞥一眼图表,就不容易在视觉上做出分析。

Smart Narrative option

比方说,现在我们打算为另一个图表生成说明。我们可以再次右键点击图表,选择总结选项。它将生成一个叙述,如下图所示。

第一个叙述是:"11月的收入TY为10,257,522美元,是最高的,比1月的收入TY最低的6,726,323美元高52.50%"。我们能够弄清楚11月的价值最高,但我们无法确定这个叙述为我们自动生成的比较分析。

下一个生成的叙述是 "RevenueTY和总收入Var%与预算呈正相关关系"。这是一个非常有趣和有价值的见解,告诉我们这两个属性是相互正相关的,这意味着另一个属性的价值随着另一个属性的价值增加而增加。负相关或反相关意味着一个属性的价值会减少,而另一个相关属性的价值会增加。

接下来的叙述是 "Nov占收入TY的11.47%"。为了直观地弄清这一见解,我们需要一个饼状图。但有趣的是,这个叙述为我们节省了屏幕空间,并自动提供了这个洞察力,而不需要任何视觉上的努力来确定这一点。

Smart narrative for column chart

仪表板的任何报告的一个重要方面是报告上呈现的信息的美学表现。生成的叙述在默认情况下是没有格式的,以配合报告的视觉主题。但是它提供了格式化叙述容器的选项,如下图所示。

Smart narrative formatting options

通过这种方式,我们可以使用智能叙事功能来生成难以从视觉上得出的见解,并在终端用户与视觉的互动中动态更新。

总结

在这篇文章中,我们首先了解了以自动化的方式从数据中产生洞察力的需求和过程。我们使用了一个现有的具有合理复杂性的Power BI报告,然后使用智能叙事功能或可视化生成纯文本的叙述,为任何给定的图表以及整个报告中的数据提供关键的见解。