我们知道Kafka是一个分布式流处理系统,流处理系统使它可以像消息队列一样publish或者subscribe消息,分布式提供了容错性,并发处理消息的机制。
虽然现在成熟的消息队列产品很多,但说到海量数据下高吞吐高并发,Kafka不是针对谁,毋庸置疑的首选!
今天给大家推荐一份Kafka学习笔记,它共12个章节452页,对Kafka基础概念、内部原理和实践应用进行了透彻的分析,图文结合,深入浅出,可读性强。注重实战,既适合Kafka初学者,又满足Kafka老手的进阶需求。
目录
- 第1章 初始Kafka
- 第2章 生产者
- 第3章 消费者
- 第4章 主题与分区
- 第5章 日志存储
- 第6章 深入服务端
- 第7章 深入客户端
- 第8章 可靠性探究
- 第9章 Kafka应用
- 第10章 Kafka监控
- 第11章 高级应用
- 第12章 Kafka与Spark的集成
第1章 初始Kafka
第 1章对 Kafka 的基础概念进行笼统的介绍,之后讲解如何安装与配置 Kafka,以及通过简单的生产消费消息的示例让读者能够快速地入门。
- 基本概念
- 安装与配置
- 生产与消费
- 服务端参数配置
第3章 消费者
第 3 章主要是针对消费者客户端的讲解, 包括消费者客户端参数、主题与分区的订阅、反序列化、消息的消费、位移提交、再均衡、拦截器、多线程实现等内容。
- 消费者与消费组
- 客户端开发
第5章 日志存储
第 5 章主要讲解日志存储相关的内容,包括文件目录的布局、日志格式的演变、日志清理的细节、底层存储的原理等内容。
- 文件目录布局
- 日志格式的演变
- 日志索引
- 日志清理
- 磁盘存储
第7章 深入客户端
第7 章主要是对 Kafka 客户端相关的原理剖析,当然其中也需要牵涉服务端的内容。这一章包括消费端分区分配策略、消费者协调器和组协调器、__consumer offsets 的剖析、事务的介绍等内容。
- 分区分配策略
- 消费者协调器和组协调器
- _consumer_offsets剖析
- 事务
第9章 Kafka应用
第9章主要是对Kafka相关应用的一些补充,包括一些重要的管理工具,还有Kafka Connect、 Kafka Mirror Maker 和 Kafka Streams 等内容。
- 命令行工具
- Kafka Connect
- Kafka Mirror Maker
- Kafka Streams
第11章 高级应用
第 11 章是对 Kafka 做一些功能性的扩展,包括过期时间、延时队列、死信队列、重试队列、消息路由、消息轨迹、消息审计、消息代理等内容,最后还通过对消息中间件选型的阐述以期让读者对整个消息中间件领域有发散性的思考。
- 过期时间(TTL)
- 延时队列
- 死信队列和重试队列
- 消息路由
- 消息轨迹
- 消息审计
- 消息代理
- 消息中间件选型
如果你对Kafka学习感兴趣,千万不要错过这份笔记。
声明:资料来源于网络,版权归原作者所有,侵删。