在Azure中,应该把数据储存在什么地方

466 阅读3分钟

在这篇文章中,我想分享最近与Azure数据湖、Azure数据资源管理器、Cosmo DB和Azure Synapse Analytics的产品经理讨论时分享的一些要点。

数据的类型

有多种类型的数据:交易、日志、历史,以及从csv到json的各种类型的文件。所有这些信息都可以是结构化或非结构化的。更有甚者,有时这种结构(被称为模式)经常变化。

针对不同情况的不同工具

这就是为什么有不同类型的工具来帮助更有效地查询你的数据,这取决于它是什么。 当然,你想运行的查询的数量和类型也会影响你选择的工具。让我们来看看其中的几个例子。

Azure数据湖

Azure数据湖是一个文件系统,旨在存储数量惊人的数据,将以非常实惠的成本支持规模。Azure数据湖实际上是Azure存储之上的一套功能,将非常适合大多数任何类型的数据。物联网数据、销售数据、我们想分析的日志等。

在我最近对杰夫-金的采访中,你可以听到他谈及Azure数据湖的一些做法和注意事项。听了他所有的建议和关于《数据湖的搭便车指南》,真的很有意思,这是所有Azure数据湖的现有用户或正在计划迁移的用户的必修课。

从这个伟大的学习模块开始吧。Azure数据湖存储简介,可在Microsoft Learn上找到。

Azure Data Explorer

Azure Data Explorer是一个分析数据库,所以它不是一个用于存储数据的普通事务性数据库,而是其用于分析数据。它擅长于时间序列和搜索非结构化或结构化数据中的文本。由于有一个自动压缩系统,它在返回查询结果方面非常快。

Vincent-Philippe Lauzon回答了我关于Azure Data Explorer、Kusto的所有问题,并在Hello World的这次简短采访中向我展示了这个工具的工作原理。

文森特还提到了一个学习模块,以开始介绍Azure Data Explorer。一个创建学习的方式来描述Azure数据资源管理器提供的摄取、查询、可视化和数据管理功能,以帮助你了解流向你业务的数据。

Azure Cosmo DB

Cosmo DB与其他数据库不同,因为它是一个可横向扩展的数据库,这使它具有大部分无限的存储容量和强大的性能。非常适合用于大量数据的摄取,或者当你需要全球范围内的高可用性时。在我对马克-布朗的采访中,他解释了这些差异,并分享了Azure Cosmo DB肯定会大放异彩的一些场景。

在Microsoft Learn上有一个完整的学习路径,名为在Azure Cosmos DB中使用NoSQL数据。这是了解NoSQL、伟大的工具和开始使用Cosmo DB的完美方式。

Azure Synapse Analytics

Azure Synapse Analytics是关于大规模进行企业分析的。Synapse真正伟大的地方在于,它与所有其他平台一起工作,统一了工具和团队。就像我们与Saveen Reddy交谈时他所说的那样。Azure Synapse就是要消除团队之间的限制,消除界限。他还分享了Synapse的最佳应用场景。你可以在这里观看这次采访

还有《Azure Synapse分析简介》,这是学习Azure Synapse分析提供的功能和组件的一个很好的模块。一站式服务满足你所有的分析需求。