首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
后端
Java
面试
Python
数据库
前端
MySQL
架构
Go
展开
全部
后端
Java
面试
Python
数据库
前端
MySQL
架构
Go
大数据
GitHub
Spring Boot
AI编程
Elasticsearch
程序员
暂无数据
推荐
最新
大数据-142 ClickHouse分片×副本×Distributed 实战 ReplicatedMergeTree、Keeper、insert_quorum
ClickHouse 分片×副本×Distributed 架构:基于 ReplicatedMergeTree + Distributed,在 3 分片×2 副本 集群上用 ON CLUSTER
大数据-141 ClickHouse 副本实战 | ReplicatedMergeTree + ZooKeeper 从 0–1:创建、选举、日志复制、排障
ClickHouse 副本全链路:ZK/Keeper 准备、macros 宏配置、集群 ON CLUSTER 一致建表、写入去重与复制机制、system.* 视图健康检查、insert_quorum
大数据-140 ClickHouse CollapsingMergeTree详解 外部数据源最小闭环HDFS/MySQL/Kafka
ClickHouse 外部数据源引擎的最小可行方案:ENGINE=HDFS、ENGINE=MySQL、ENGINE=Kafka 的 DDL 模板、关键参数与读写链路。示范 Kafka→Material
给DataX配置加密的方法
给DataX配置加密的方法 前言 在生产环境中使用DataX,往往在json配置文件中需要用到数据库的账号信息,这是非常不安全的。好在DataX自带的功能支持对敏感信息加密解密,达到对配置文件信息脱敏
大数据-139 ClickHouse MergeTree 最佳实践:Replacing 去重、Summing 求和、分区设计与物化视图替代方案
ClickHouse 两大轻聚合引擎 ReplacingMergeTree 与 SummingMergeTree,结合最小可运行示例(MRE)与对照查询,解释为何去重/求和仅在合并阶段生效
Hive的架构设计和建表语义
**更多干货抢先看:**[大数据干货合集](https://mp.weixin.qq.com/s/e
大数据-138 ClickHouse MergeTree 实战详解|分区裁剪 × 稀疏主键索引 × marks 标记 × 压缩
ClickHouse MergeTree 的存储与查询路径:列式文件(*.bin)、稀疏主键索引(primary.idx)、标记文件(.mrk/.mrk2)与 index_granularity
大数据-137 ClickHouse MergeTree 实战指南|分区、稀疏索引与合并机制 存储结构 一级索引 跳数索引
ClickHouse MergeTree 的关键机制:批量写入形成 part、后台合并(Compact/Wide 两种 part 形态)、ORDER BY 即稀疏主索引、index_granulari
货拉拉用户画像基于 Apache Doris 的数据模型设计与实践
导读 用户画像与实时数据分析是互联网企业的数据核心。货拉拉作为覆盖全球多地区的同城货运平台,基于 Apache Doris 构建了高效的人群计算系统,支撑用户画像的批
Flink Table API:让流批处理更简单
在大数据领域,流处理与批处理长期处于割裂状态:实时场景依赖Kafka Streams等工具处理动态数据流,而离线分析则需借助Hive或Spark进行批量计算。这种双轨制不仅增加了开发复杂度,更导致维护
大数据-136 - ClickHouse 集群 表引擎详解 选型实战:TinyLog/Log/StripeLog/Memory/Merge
梳理 ClickHouse 表引擎:TinyLog、Log、StripeLog、Memory、Merge 的原理、适用与坑点,并给出可复制的最小可运行示例(MRE)
大数据-135 ClickHouse 集群连通性自检 + 数据类型避坑实战|10 分钟跑通 ON CLUSTER
先完成集群连通性自检:system.clusters 校验 → ON CLUSTER 创建 ReplicatedMergeTree/Distributed,然后研究ClickHouse各种数据类型
大数据-134 ClickHouse 单机+集群节点落地手册 | 安装配置 | systemd 管理 / config.d
官方推荐的 keyring + signed-by 在 Ubuntu 安装 ClickHouse,并用 systemd 启动与自检;提供单机与集群多节点的最小示例。
大数据-133 ClickHouse 概念与基础|为什么快?列式 + 向量化 + MergeTree 对比
面向“高并发、低延迟 OLAP”场景,本文从工程视角讲清 ClickHouse 的底层优势(列式+压缩+向量化、MergeTree 家族)、适用与不适用边界(OLAP vs 强事务)、数据建模基本法
大数据-132 Flink SQL 实战入门 | 3 分钟跑通 Table API + SQL 含 toChangelogStream 新写法
工程视角快速跑通 Flink SQL:提供现代依赖(不再使用 blink 规划器)、最小可运行示例(MRE)、Table API 与 SQL 互操作;输出使用 toChangelogStream 验证
大数据-129 - Flink CEP详解:实时流式复杂事件处理(Complex Event Processing)全解析
Flink中专用于复杂事件流实时分析的核心组件,提供完整的模式匹配框架,支持基于事件时间(Event Time)的乱序处理与高性能NFA(非确定性有限自动机)匹配机制。
Flink容错机制:Checkpoint和Savepoint深入解析
在分布式流处理领域,数据可靠性是系统的生命线。Apache Flink作为实时计算的标杆框架,通过精巧的容错设计实现了exactly-once语义保障。其核心依赖两大机制:Checkpoint(自动容
Apache Flink入门:实时数据处理的利器
Apache Flink入门:实时数据处理的利器 在当今数据爆炸的时代,实时数据处理已成为企业获取竞争优势的关键能力。传统的批处理模式已无法满足对即时洞察的需求,而Apache Flink作为新一代流
Flink vs Spark Streaming:谁更适合你的实时处理需求?
在大数据实时处理领域,Apache Flink和Apache Spark Streaming是两大主流框架。它们都能处理实时数据流,但设计理念和适用场景却大不相同。本文将深入浅出地分析两者的核心差异,
Flink内存管理:如何避免`OutOfMemoryError`
在分布式流处理领域,Apache Flink 以其低延迟、高吞吐的特性广受青睐。然而,许多开发者在实际部署中常遭遇 OutOfMemoryError(OOM)这一棘手问题,导致作业频繁崩溃、数据处理中