数据

数据相关

等 60 人订阅共300篇文章创建于2023-05-27

构建Snowflake数据云——架构

理解 Snowflake 如何运作有助于您制定在 Snowflake 数据云中实现自己贡献的战略。Snowflake 针对数据仓库进行了优化，但并不适合 OLTP（联机事务处理）。本章清楚地解释了这一

11月前
299
点赞
评论

构建Snowflake数据云——架构

构建Snowflake数据云——打破数据孤岛

每个组织都有数据孤岛——这些是由有限的特定人员群体严格控制的、被隔离的数据存储库和IT系统，他们对自己的数据守口如瓶。传统上，每个孤岛都作为一个自给自足的小型业务运作，彼此之间的重叠和数据交换极少。而

11月前
118
点赞
评论

构建Snowflake数据云——打破数据孤岛

构建Snowflake数据云——介绍

Snowflake数据云是一个让数据可以在全球范围内几乎实时地被愿意参与的各方共享和消费的平台——这一过程无缝且安全。Snowflake提供了解决方案，能够消费、重新格式化、分类和发布各种数据格式，并

11月前
252
点赞
评论

构建Snowflake数据云——介绍

Aerospike：入门与实战——高级概念

一些最具挑战性的用例超出了单一地点运行消费者服务的基本概念。地理分布式部署通常用于为大量（数百万到数十亿）消费者提供实时服务。这些服务通常需要可预测的低延迟服务级协议（SLA，以毫秒为单位）以及全天候

12月前
243
点赞
评论

Aerospike：入门与实战——高级概念

Aerospike：入门与实战——管理、工具和配置

现在您已准备好上线一个 Aerospike 集群，您需要了解如何保持系统在线并应对变化。理解与服务器交互的流程至关重要，这样才能将其作为生产环境的一部分进行管理。您需要了解如何集群服务器、调整参数以及

12月前
331
1
评论

Aerospike：入门与实战——管理、工具和配置

Aerospike：入门与实战——数据模型

在前几章中，我们讨论了Aerospike的架构以及数据库所提供的功能。在本章中，我们将探讨如何在Aerospike中进行数据建模以解决常见问题。与大多数数据库一样，解决相同问题的方法有多种，因此我们会

12月前
348
点赞
评论

Aerospike：入门与实战——数据模型

Aerospike：入门与实战——架构

由于你刚开始使用 Aerospike，本章不会详细解释数据库的构建方式。然而，了解 Aerospike 的一些关键工作原理有助于理解为什么要以特定方式使用它，以及如何充分利用其功能。本章将重点讨论三

12月前
355
2
评论

Aerospike：入门与实战——架构

Aerospike：入门与实战——高级操作

到目前为止，你已经了解了 Aerospike 的基本操作，主要是读取和写入数据。我们讨论了数据如何存储在 bin 中，并且可以在一次调用中读取或写入多个 bin。接下来，我们将探讨一些超出这些基本操作

12月前
340
点赞
2

Aerospike：入门与实战——高级操作

Aerospike：入门与实战——基本操作

在第 2 章中，我们展示了一个入门示例应用的基本样式，并简要讨论了如何建立连接、检索数据和插入数据。本章中，我们将深入介绍在使用 Aerospike 时会用到的所有基本操作，如创建、读取、更新和删除等

12月前
454
点赞
评论

Aerospike：入门与实战——基本操作

Aerospike：入门与实战——开发你的第一个 Aerospike 应用程序

现在你已经了解了 Aerospike 的基础知识，接下来让我们开始编写第一个使用 Aerospike 作为数据库的程序。Aerospike 支持多种编程语言，如 Java、C、C#、Python 和

12月前
473
1
评论

Aerospike：入门与实战——开发你的第一个 Aerospike 应用程序

Aerospike：入门与实战——Aerospike简介

Aerospike 是一款分布式 NoSQL 数据库，在读写速度上表现出色，且具备很高的系统可用性。这听起来像是数据库的常见特性，但这并没有全面展现 Aerospike 的能力。在数据管理行业，我们

12月前
492
点赞
评论

Aerospike：入门与实战——Aerospike简介

《Databricks数据智能平台：解锁生成式AI革命》——Databricks平台：从Lakehouse到数据智能平台

随着数字化转型步伐的加快，各家公司从各种来源收集的多样化数据量不断增加。数据爆炸为组织提供了巨大的潜力，通过高级分析发掘出颠覆性的洞察，以引导创新和决策。在本章中，我们将回顾数据平台在过去十多年中的

1年前
381
点赞
评论

《Databricks数据智能平台：解锁生成式AI革命》——Databricks平台：从Lakehouse到数据智能平台

数据工程最佳实践——业务问题陈述概述

我们从定义业务问题陈述的任务开始。 “企业面临不断变化的技术环境。竞争要求企业在规模上进行创新以保持相关性，这导致了在系统生命周期的运行/管理阶段中，必须不断地分配总拥有成本（TCO）预算来进行重构和

1年前
112
3
评论

数据工程最佳实践——业务问题陈述概述

使用 Apache Arrow 进行内存分析——如何在 Arrow 项目中留下你的印记

那么，你有一些让 Arrow 变得更好的想法，或者可能你发现了一个错误。无论是哪种情况，你都希望能够与 Arrow 项目沟通你的需求和想法，或者贡献代码更改。本章就是关于如何进行这些操作的入门指南。无

1年前
247
点赞
评论

使用 Apache Arrow 进行内存分析——如何在 Arrow 项目中留下你的印记

使用 Apache Arrow 进行内存分析——由 Apache Arrow 驱动

随着越来越多的项目采用或支持 Apache Arrow 作为其内部和外部通信格式，Arrow 正逐渐成为行业标准。在本章中，我们将了解一些以不同方式使用 Arrow 的项目。Arrow 提供的灵活性使

1年前
329
点赞
评论

使用 Apache Arrow 进行内存分析——由 Apache Arrow 驱动

使用 Apache Arrow 进行内存分析——在机器学习工作流中使用 Arrow

我们刚刚讨论了如何使用 Arrow 数据库连接 (ADBC)，它提供了一种与多种数据源进行高效交互的方式。在本章中，我们将探讨如何使用这些数据：即机器学习（ML）。ML 绝不仅仅是一个流行词汇——它经

1年前
545
点赞
评论

使用 Apache Arrow 进行内存分析——在机器学习工作流中使用 Arrow

使用 Apache Arrow 进行内存分析——理解 Arrow 数据库连接 (ADBC)

在之前的几个章节中，我们讨论了许多使用 Apache Arrow 处理和交互数据的方法。我们甚至还介绍了如何利用一些 Arrow 库（如 Dataset 库）来获取和分析数据。但是，如果你的日常工作涉

1年前
869
点赞
评论

使用 Apache Arrow 进行内存分析——理解 Arrow 数据库连接 (ADBC)

使用 Apache Arrow 进行内存分析——探索 Apache Arrow Flight RPC

分布式系统一直让我感兴趣。分布式系统就像一个非常好的拼图；一旦你弄清楚所有的部分如何结合在一起以实现你的目标，便会感到极大的满足。如果你不熟悉这个术语，分布式系统简单来说就是将系统的各个组件分散在网络

1年前
711
点赞
评论

使用 Apache Arrow 进行内存分析——探索 Apache Arrow Flight RPC

使用 Apache Arrow 进行内存分析——使用 Arrow Datasets API

在当前的数据湖和湖仓生态系统中，许多数据集现在是分区目录结构中的大型文件集合，而不是单个文件。为了简化这种工作流程，Arrow 库提供了一个 API，用于轻松处理这些类型的结构化和非结构化数据。这被称

1年前
388
1
评论

使用 Apache Arrow 进行内存分析——使用 Arrow Datasets API

使用 Apache Arrow 进行内存分析——跨越语言障碍：使用 Arrow C 数据 API

我不想显得像在重复老调重弹，但我已经多次提到，Apache Arrow 是一组库的集合，而不是一个单一的库。这在技术和后勤方面都有重要的区别。从技术角度来看，这意味着依赖于 Arrow 的第三方项目不

1年前
379
点赞
评论

使用 Apache Arrow 进行内存分析——跨越语言障碍：使用 Arrow C 数据 API