首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据
数据智能老司机
创建于2023-05-27
订阅专栏
数据相关
等 56 人订阅
共247篇文章
创建于2023-05-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
使用 Apache Arrow 进行内存分析——如何在 Arrow 项目中留下你的印记
那么,你有一些让 Arrow 变得更好的想法,或者可能你发现了一个错误。无论是哪种情况,你都希望能够与 Arrow 项目沟通你的需求和想法,或者贡献代码更改。本章就是关于如何进行这些操作的入门指南。无
使用 Apache Arrow 进行内存分析——由 Apache Arrow 驱动
随着越来越多的项目采用或支持 Apache Arrow 作为其内部和外部通信格式,Arrow 正逐渐成为行业标准。在本章中,我们将了解一些以不同方式使用 Arrow 的项目。Arrow 提供的灵活性使
使用 Apache Arrow 进行内存分析——在机器学习工作流中使用 Arrow
我们刚刚讨论了如何使用 Arrow 数据库连接 (ADBC),它提供了一种与多种数据源进行高效交互的方式。在本章中,我们将探讨如何使用这些数据:即机器学习(ML)。ML 绝不仅仅是一个流行词汇——它经
使用 Apache Arrow 进行内存分析——理解 Arrow 数据库连接 (ADBC)
在之前的几个章节中,我们讨论了许多使用 Apache Arrow 处理和交互数据的方法。我们甚至还介绍了如何利用一些 Arrow 库(如 Dataset 库)来获取和分析数据。但是,如果你的日常工作涉
使用 Apache Arrow 进行内存分析——探索 Apache Arrow Flight RPC
分布式系统一直让我感兴趣。分布式系统就像一个非常好的拼图;一旦你弄清楚所有的部分如何结合在一起以实现你的目标,便会感到极大的满足。如果你不熟悉这个术语,分布式系统简单来说就是将系统的各个组件分散在网络
使用 Apache Arrow 进行内存分析——使用 Arrow Datasets API
在当前的数据湖和湖仓生态系统中,许多数据集现在是分区目录结构中的大型文件集合,而不是单个文件。为了简化这种工作流程,Arrow 库提供了一个 API,用于轻松处理这些类型的结构化和非结构化数据。这被称
使用 Apache Arrow 进行内存分析——跨越语言障碍:使用 Arrow C 数据 API
我不想显得像在重复老调重弹,但我已经多次提到,Apache Arrow 是一组库的集合,而不是一个单一的库。这在技术和后勤方面都有重要的区别。从技术角度来看,这意味着依赖于 Arrow 的第三方项目不
使用 Apache Arrow 进行内存分析——Acero:一个流式 Arrow 执行引擎
我们已经翻阅了这本书将近一半的内容,但直到现在才开始介绍如何直接使用 Arrow 进行分析计算。这有点奇怪,对吧?不过此时,如果你一直在跟随书中的内容,你应该已经对所有需要掌握的概念有了扎实的理解,从
使用 Apache Arrow 进行内存分析——格式与内存处理
我一直在称赞 Apache Arrow 作为表格数据交换技术的优势,但它与人们常用的数据传输技术相比表现如何呢?对于你的应用程序接口(API),什么时候使用一种技术比另一种更合适呢?要回答这些问题,你
使用 Apache Arrow 进行内存分析——使用关键的 Arrow 规范
分析和计算工具只有在拥有数据的情况下才有用。数据可以存在于本地或远程的多种位置和格式中。Arrow 库提供了一系列功能,用于从不同的格式和位置读取数据并进行交互。在你已经对 Arrow 及其数组操作有
使用 Apache Arrow 进行内存分析——Apache Arrow 入门指南
无论你是数据科学家/工程师、机器学习(ML)专家,还是一名试图构建数据分析工具的软件工程师,你很可能已经听说过或阅读过有关 Apache Arrow 的内容,并可能想要了解更多信息,或好奇它究竟是什么
实现Data Mesh——通过数据契约驱动数据产品
在本章中,我们将首先从实施的角度来看待数据网格,回答以下问题:它的主要组件是什么?然后,我们将与产品思维进行对比,探讨什么是数据产品,最后深入讨论数据契约。本章中的示例遵循我们用例的主题,即Clima
实现Data Mesh——定义Data Mesh架构
本章将讨论数据网格的核心架构组件。内容分为两个主要部分。首先,我们讨论数据产品架构,包括支持广泛工件集所需的组件以及开发、运行和操作数据产品所需的组件。其次,我们重点介绍将所有数据产品整合为一个统一整
实现Data Mesh——我们的案例研究:Climate Quantum Inc.
在本章中,我们将介绍我们的案例研究——Climate Quantum Inc.,并在其中应用数据网格能力来应对一个重要且紧迫的需求:气候变化。 首先,让我们提供一些背景信息。 气候变化渗透到全球社会的
实现Data Mesh——应用数据网格的原则
最简单来说,数据网格就是一个由互相作用的数据产品组成的生态系统,如图2-1所示。和任何生态系统一样,数据网格中有许多独立运行的部分,它们通过共同的标准和通信骨干相互连接。理想情况下,数据网格中的数据产
实现Data Mesh——理解数据网格:基本要素
在快速变化的企业数据管理领域,数据网格(Data Mesh)已从一个新兴概念演变为现代数据架构的基石。其崛起标志着组织在应对日益复杂和庞大的数据生态系统方面的重大转变。Zhamak Dehghani
数据摄取与存储
在上一章中,我们介绍了23种不同的数据云菜单选项,并将其归纳为五种核心能力。本章将深入探讨其中的第一种,即Salesforce数据云的数据摄取与存储能力。我们将探索与以下数据摄取和存储能力相关的三个菜
Data Cloud 菜单选项
在本章中,我们将从总体上回顾每个 Salesforce Data Cloud 菜单选项。在后续章节中,我们会详细探讨这些菜单选项。本章的目的是向您介绍我们在学习过程中将使用的 Salesforce D
Salesforce的业务价值活动
第2章中,我们学习了数据云(Data Cloud)架构是如何从零开始构建的,使得 Salesforce 客户数据平台(CDP)独具特色。与仅使用批处理的传统 CDP 不同,数据云能够以近乎实时的方式运
Salesforce 数据云的基础
正如我们在第1章中看到的,Salesforce数据云可以解决许多问题。虽然它需要一些初始设置,但在日常操作中,数据云将由管理员进行管理。除了管理员之外,可能还有许多不同的最终用户需要访问数据云中的统一
下一页