首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户2615220038255
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
40
文章 25
沸点 15
赞
40
返回
|
搜索文章
最新
热门
Parquet 列式存储格式| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第18天。 Parquet 是 Hadoop 生态圈中主流的列式存储格式,最早是由 Twitter 和 Cloudera 合作开发
消息队列 Kafka 和 Pulsar | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第17天。 消息队列(Message Queue,简称MQ),指保存消息的一个容器,本质是个队列。 消息(Message)是指在应用之间传送的数据
Hbase 之 region split 和 region merge | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第16天。 前言 在Hbase中,Region是分布式Table中的分区存储单元,每一个Region代表特定rowkey区间内的数据片段,每个Region中存
HBase 模型详解及应用场景举例| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天。 HBase概述 HBase是一个构建在HDFS上的分布式列存储系统。HBase是Apache Hadoop生态系统中的重要 一员
HDFS高可用(HA)之ZKFC详解 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天。对于NameNode的高可用可以分为共享editLog机制和ZKFC对NameNode状态的控制 这篇文章的重点放在ZKFC对于Namenode控制
查询性能优化之Runtime Filter| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天。 在分析类查询中,大表之间(或大表与小表)的 Join 通常使用 Hash Join 实现,这通常也是查询的性能瓶颈之一,因此如何优化join的查询
HDFS 介绍及原理解析| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天。 本文将以Apache HDFS为蓝本,重点介绍HDFS的相关概念及原理,并给出分布式文件存储系统的对比及选择推荐。
Presto 架构原理与优化介绍| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第11天。 Presto是Facebook开源的查询分析引擎,在国内京东用的比较成熟。Presto数据处理能力到达PB级别,支持查询数据源广泛
Spark 3.2.0 版本新特性 push-based shuffle | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第10天。 背景 在 Spark 计算基础设施的大规模部署中,Spark Shuffle 正在成为潜在的扩展瓶颈和集群效率低下的原因,新解决方案如下
Flink 中实现 Exactly Once 语义的两大机制详解及其优化方案| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第9天。Checkpoint 机制和 Two-phase commit protocol 是实现Flink Exactly-once语义的两大关键机制
下一页
个人成就
文章被点赞
57
文章被阅读
12,684
掘力值
345
关注了
0
关注者
2
收藏集
0
关注标签
2
加入于
2022-07-06