首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据
数据智能老司机
创建于2023-05-27
订阅专栏
数据相关
等 58 人订阅
共253篇文章
创建于2023-05-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Apache Polaris权威指南——使用 Apache Polaris 开源版
在前面的章节中,我们深入探讨了 Apache Polaris、其关键特性以及 API。现在,是时候走出理论,动手在本地部署并使用 Apache Polaris 了。通过实操,你将理解各组件如何协同工作
Apache Polaris权威指南——Polaris REST API
在本章中,我们将深入介绍 Apache Polaris 提供的 REST API,用于管理 catalogs、roles、namespaces、tables 与 views。Polaris REST
Apache Polaris权威指南——外部目录
在某些情况下,组织会同时管理多个 Iceberg 目录(catalog) ,以满足特定的工作负载、团队分工、合规要求或运行需求。尽管多目录策略有助于优化数据战略,但也带来了统一访问与无缝集成方面的挑战
Apache Polaris权威指南——Apache Polaris 的安全模型
本章将探讨 Apache Polaris 的安全模型,重点说明它如何实现细粒度访问控制、确保合规,并促进跨团队的无缝协作。通过将 主体(principals) 、主体角色(principal role
Apache Polaris权威指南——Apache Iceberg Catalog 的作用
正如上一章所示,Apache Iceberg 为数据湖仓带来了强大的表管理能力,通过 ACID 事务、Schema 演进与时光回溯等特性,实现可靠且可扩展的数据操作。但要充分释放 Iceberg 表的
Apache Polaris权威指南——数据湖仓架构与 Apache Iceberg
当今组织正在生成海量信息,因此高效地存储、管理与分析这些数据变得至关重要。数据的庞大规模与多样性带来了独特挑战——从确保可访问性到在大规模下维持性能。现代数据架构正是为此而生。要全面理解开源数据湖仓目
将外部系统与 Kafka Connect 集成
本章涵盖 将 Kafka 与数据源和接收端集成 为最佳数据流配置连接器和 worker 使用 REST API 管理 Kafka Connect 创建与修改连接器 使用 JDBC 源和 Debeziu
kafka:清理消息
本章内容概览: Kafka 中消息清理的机制 管理消息保留的可选策略 Kafka 如何处理过期数据的清理 在 Kafka 中,管理消息的生命周期对于维持系统性能和保证数据完整性至关重要。本章介绍两种关
kafka:消费消息
本章内容: Kafka 的基于 fetch 的消费模型 偏移量管理 消费组的作用 Kafka 如何协调任务分配 Range Assignor 与 Round Robin Assignor 的影响 静态
kafka:生产并持久化消息
本章通常使用官方的 Kafka Java 库,或者当生产者不运行在 JVM 中时,使用基于 C 库 librdkafka(https://github.com/confluentinc/librdka
kafka的集群管理
本章内容 使用 KRaft 与 ZooKeeper 进行 Kafka 集群管理 从 ZooKeeper 迁移到 KRaft 客户端如何连接到 Kafka 在前面的章节中,我们已经把 Kafka 作为一
kafka的性能
本章内容包括 提高性能的主题(topic)设置 确定主题最佳分区数 影响性能的 Kafka broker 设置 生产者和消费者的性能调优 在上一章中,我们学习了如何用 Kafka 可靠地生产消息。本章
Kafka的可靠性
本章内容包括 Kafka 的确认(ACK)设置 Kafka 中的数据可用性与容错性 Kafka 的投递保证(delivery guarantees) Kafka 的事务能力 Kafka 中的主从(Le
Kafka:分布式日志系统
本章内容包括 日志的用途与属性 将 Kafka 视为一种基于日志的系统 作为分布式系统的 Kafka:分区与复制 进一步剖析 Kafka 集群组件 Kafka 在企业环境中的应用 在本章中,我们将探讨
探索 Kafka 主题与消息
本章内容包括 操作 Kafka 主题 主题如何构建 Kafka 中的数据流结构 消息 —— Kafka 中的基本数据单元 在本章中,我们将深入探讨 Apache Kafka 的基础要素:主题以及消息的
首选:Kafka 入门
本章内容包括 介绍本书的示例用例 使用 kafka-topics.sh 命令创建主题(topic) 使用 kafka-console-producer.sh 命令发送(生产)消息 使用 kafka-c
Apache Kafka 简介
本章内容包括 Apache Kafka 是什么及其使用场景 Kafka 在企业生态系统中的定位与作用 Kafka 的架构概览 Kafka 的运行与使用 现代企业应用通常由彼此独立的组件和服务构成,这些
AI领域的现代数据架构——面向 AI 工作负载的数据存储与管理
引言 在大数据与人工智能时代,健壮的数据存储与管理是成功 AI 计划的支柱。本章审视这些关键组成部分,强调它们在整体 AI 架构中的角色。 我们将探讨数据存储架构:本地(on-premises)、云端
AI领域的现代数据架构——数据收集与摄取策略
引言 在数据驱动的决策领域,旅程始于有效的数据收集与摄取策略。本章将探讨数据采集与导入的基础环节,它们是开展高级分析或人工智能驱动项目的基石。我们的目标是全面理解收集与摄取多源数据所涉及的方法论、工具
AI领域的现代数据架构——AI现代数据架构导论
引言 本章介绍人工智能(AI)系统现代数据架构的基本概念,涵盖从传统数据库到分布式和云原生解决方案的演进过程。我们将探讨AI数据管理的独特挑战,包括可扩展性、实时处理和非结构化数据处理。我们还将深入讨
下一页