在本文中,我们将学习如何在Azure Blob存储账户中配置Blob库存。
简介
在任何企业的IT环境中,数据都是不断增长的商品之一。随着云计算的出现,托管数据的基础设施的挑战已经得到解决,在云上按需托管大量的数据已经变得非常容易,不需要任何前期的资本支出成本或准备时间。数据开始直接以及间接增长的基本场所之一是blob存储,用户以及应用程序在这里读取和写入数据。考虑到blob存储是数据生态系统的中心,数据量可以以惊人的速度极大地增长。Azure提供Azure Blob Storage作为其在Azure云上的blob存储产品。根据不同的使用情况,许多行业都需要密切跟踪数据的库存,原因有很多,从简单的数据跟踪到复杂的合规管理。为了满足这一需求,Azure Blob Storage提供了配置功能的选项,可以自动跟踪Blob Storage上的数据库存,并生成相关报告以帮助进行库存跟踪。
配置Blob库存
要开始下面的练习,我们需要一个Azure账户,其中至少要创建一个Azure Blob Storage账户。人们需要有管理权限来操作这项服务,以执行下面提到的练习。假设这个账户、配置和设置已经到位。登录Azure门户,导航到存储账户的仪表板。在我们开始进行库存管理之前,我们至少需要有一些容器或一个有一些文件的容器,这样我们就可以有一些库存来跟踪和报告。我们假设已经有了这样的设置。一旦有了这样的设置,点击Azure Blob Storage账户左侧窗格中的Blob Inventory菜单项,就会打开一个页面,如下所示。
我们需要创建一个库存规则,在这里我们将指定要跟踪的库存范围,以支持的格式之一。单击 "添加规则"按钮,它将打开一个弹出屏幕,如下所示。首先,我们需要提供一个规则名称,然后选择我们希望创建库存文件的容器。然后,我们需要选择我们是否要跟踪Blobs或容器。比方说,我们想跟踪容器,所以选择对象类型为容器。默认情况下,将选择三个字段,这些字段将被包含在为库存跟踪而创建的报告中。我们可以选择从支持的字段列表中选择我们需要的字段。如果库存每天都在急剧变化,或者如果某些合规性要求每天进行库存跟踪,我们可以选择每天的选项,或者在其他情况下,我们可以选择每周的选项。最后,我们需要选择将创建的文件格式,该文件将有一个库存清单。默认情况下,选择CSV导出格式。我们也可以选择Parquet作为格式。如果我们打算将其作为数据加载到一些数据仓库存储库中进行分析,这可能很有用。
完成后,点击 "保存"按钮,创建一个新的规则。一旦规则被创建,它将如下图所示。如果我们点击Blob inventory设置,它将在弹出的窗口中显示设置,如下图所示。启用Blob库存的设置将被启用。我们还可以选择启用访问跟踪选项,以跟踪blob的使用情况,作为库存跟踪的一部分。对于高度敏感的数据,这是一个非常重要的设置,应该被启用。
库存规则需要时间来生效。由于我们已经配置了每天的频率,它可能需要一天时间来生成库存跟踪报告。一旦规则执行,它将在选定的容器中创建一个文件夹结构,如下所示。打开与该规则名称相同的文件夹。
在这个文件夹下,会有一个年、月、日的层次结构,在这个层次中,我们可以看到如下所示的文件。一个是用于验证文件完整性的校验和文件,一个是有配置和跟踪的库存细节的清单文件,而CSV文件里有实际跟踪的库存。
点击CSV文件,我们会得到下载该文件的选项。下载并打开该文件,它看起来如下所示。这里显示了容器的列表,以及我们在创建规则时配置的三个字段。如果我们选择Blobs,这个列表会更长,因为通常情况下,与容器相比,一个人有很多文件。
这样一来,通过使用Azure Blob Storage账户的Blob Inventory功能,我们可以轻松地管理和跟踪Azure Blob Storage账户中托管的Blobs的库存。
总结
在这篇文章中,我们学习了如何在Azure Blob Storage账户中创建规则,使用Blob库存功能来跟踪库存以及对库存的访问,最后还按所需频率创建了自动库存报告。