首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据一锅端
武子康
创建于2024-10-12
订阅专栏
详细记录大数据的踩坑,包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件,覆盖离线+实时数仓全栈。让我们一起无限进步!
等 20 人订阅
共157篇文章
创建于2024-10-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大数据-58 Kafka 消息发送全流程详解:序列化、分区策略与自定义实现
Kafka 消息发送是生产者将数据写入主题的过程,涉及消息创建、序列化、分区选择和发送。生产者构造包含主题、键(可选)、消息体、时间戳和头部信息的消息,通过序列化器将键和值转为字节数组。
大数据-57 Kafka 高级特性 Producer 消息发送流程与核心配置详解
Kafka Producer 在初始化时会创建 Sender 线程、RecordAccumulator 缓冲区并加载拦截器、序列化器及分区器。消息发送过程包括拦截处理、key/value 序列化。
大数据-56 Kafka Spring Boot 使用 Kafka 开发分布式消息系统详解 附代码
Spring Boot 中集成 Kafka,实现消息的生产与消费。通过配置 pom.xml 和 application.yml,使用 KafkaTemplate 发送消息,@KafkaListener
大数据-55 Kafka 实战详解:sh启动、主题管理、Java客户端完整示例
Kafka 启动支持使用 -daemon 参数以守护进程方式在后台运行,避免 SSH 断开后服务终止。通过 kafka-topics.sh 可进行主题的创建、查看、删除等操作。
大数据-54 Kafka 安装配置 从 ZooKeeper 到 KRaft 的演进之路
Kafka 在 2.X 版本中引入了诸多企业级增强,包括 Kafka Streams 的全面升级(如支持交互式查询、外连接、全局表等),Producer 和 Broker 的性能优化,以及动态配置。
大数据-53 Kafka 架构精讲:Producer、Broker、Consumer 全流程解析
Kafka 是一款高性能、可扩展的分布式消息系统,采用发布-订阅模型,具备高吞吐、低延迟、持久化存储等特性。其核心架构由生产者、Broker、消费者组成,消息以分区形式写入并消费,实现高并发处理。
大数据-52 Kafka 架构全解析:高吞吐、高可用分布式消息系统的核心奥秘
Kafka 是由 LinkedIn 开发并贡献给 Apache 的高吞吐量、分布式消息队列系统。其核心特点包括分区机制、复制策略、水平扩展能力和持久化能力,适用于日志收集、异步通信、实时流处理等场景。
大数据-51 Redis 分布式锁到哨兵机制:一文掌握Redis高可用架构
本节重点介绍了Redis在分布式系统中的高可用实现方案。首先回顾了Redis分布式锁、SETNX原理、Redisson工具及Java实现方式。随后系统讲解了高可用的核心理念与AP模型。
大数据-50 Redis Java Lua实现乐观锁、WATCH机制与SETNX分布式锁
乐观锁是一种高效的并发控制机制,核心基于CAS(比较并交换)实现,假设操作间冲突概率较低。通过版本号或时间戳来判断数据是否被修改,避免传统锁的阻塞和死锁问题。
大数据-49 Redis 缓存异常全攻略:穿透、击穿、雪崩、热Key、大Key通杀指南
缓存系统在高并发场景下容易出现缓存穿透、缓存击穿和缓存雪崩等问题,严重时可导致数据库崩溃。 缓存穿透可通过空值缓存和布隆过滤器防御;缓存击穿则常用分布式锁、永不过期缓存或预加载机制缓解
大数据-48 Redis 深入理解Redis通信机制:从RESP协议到Reactor事件驱动模型
Redis采用单线程+多路复用架构,通过事件驱动实现高并发处理。通信基于RESP协议,定义了简单字符串、错误、整数、批量字符串和数组五种数据格式,具有可读性强、易解析、支持二进制等优点。
大数据-47 Redis 内存控制、Key 过期与数据淘汰策略详解
Redis在理想环境下具备极高读写性能,但在实际应用中受网络、数据结构复杂度等影响。内存使用是Redis运维的核心挑战,Key数量持续增长可能导致内存耗尽。Redis提供多种内存淘汰策略。
大数据-46 Redis RDB 持久化机制详解:原理、配置与优缺点解析
RDB(Redis Database)是 Redis 默认的持久化方式,通过定期生成内存快照将数据保存为二进制文件 dump.rdb。当持久化触发时,Redis 主进程会 fork 子进程。
大数据-45 Redis 从快照到日志:RDB 与 AOF 持久化机制
Redis 提供两种主要持久化机制:RDB 和 AOF。RDB 通过定时快照将内存数据写入磁盘,优点是恢复快、文件小,适合灾备和快速启动,但可能丢失最后一次快照后的数据。
大数据-44 Redis 慢查询日志详解与性能优化实战指南
Redis 提供了类似 MySQL 的慢查询日志机制,用于记录执行时间超过指定阈值的命令,帮助开发者分析性能瓶颈与系统异常。通过配置 slowlog-log-slower-than 和 slowlog
大数据-43 Redis Lua脚本实战全解析 eval redis.call redis.pcall
Lua 是一门轻量级、高性能、易嵌入的脚本语言,被广泛应用于游戏开发、嵌入式系统和数据处理领域。而在 Redis 中,Lua 脚本因其原子性与灵活性成为复杂操作和事务逻辑的首选工具。
大数据-42 Redis 发布/订阅详解:机制、弱事务性与实际风险分析
Redis 发布/订阅(Pub/Sub)是一种轻量级消息通信机制,支持客户端订阅频道,并由发布端向频道推送消息,订阅端实时接收。它适合实时通知、日志分发等场景,但存在“弱事务性”:不持久、不确认。
大数据-41 Redis 类型集合(2) bitmap geohash Z阶曲线 Base32
Redis的Bitmap、Geo和Stream类型是处理高效数据存储与分析的重要利器。**Bitmap适用于用户签到、活跃状态等布尔集合问题,凭借位级操作大幅节省存储空间;Geo类型通过Z阶曲线等
大数据-40 Redis 类型集合 string list set zsorted hash 详解
Redis 常用命令及其典型应用场景。首先介绍了通用键空间命令如 EXISTS、DEL、EXPIRE、SCAN 等,强调了性能与使用场合的取舍。随后详细解析了五种核心数据类型。
大数据-39 Redis 源码编译安装 启动 redis-server redis-cli
Redis 是高性能开源键值数据库,内存读写快,支持RDB/AOF持久化、主从、哨兵、事务,常用于缓存与队列。源码自编译可率先修补漏洞,并按需启用TLS、JSON模块或systemd。
下一页