首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
国家的树苗
更多收藏集
微信扫码分享
微信
新浪微博
QQ
9篇文章 · 0订阅
一篇文章搞懂 HBase 的内部原理
绝对的一篇文章就能搞懂 HBase 的底层实现基本原理,图文并茂,逻辑清晰,格式工整,进来看一看吧~
HBase 存储原理
底层存储结构如下,行式存储是存储玩一行,接着存储下一行,而列式存储是把一列数据存储在一起,由于列数据不存在一列存完了的概念,所以列数据与列数据之间不是紧挨着的,而是相互分离的。 上面对行式存储与列式存储的介绍是从比较宽泛的角度出发的,并不是说 HBase 是列式存储,它的内部设…
Spark调优指南
本文是关于Spark优化性能与内存使用的最佳实践,翻译整理自Tuning - Spark 3.3.2 Documentation。由于spark内存计算的特性,很多因素都会影响Spark的表现:CPU
Flink 流批一体在字节跳动的探索与实践
文章由火山引擎云原生计算产品经理-付振雄在 2022 全球互联网架构大会(GIAC)上的演讲整理而成。
hive 字符串提取&json格式解析
在数据存储时研发端经常为了方便很多字段为了冗余存储了文本格式:json或者固定分隔符,但数仓和数据分析在处理又要进行取出单独的某个字段使用,本文会详解下平时在工作中遇到的问题与处理方法。
No.16 【漫谈数据仓库】 拉链表
No.12 【漫谈数据仓库】维度建模
Hadoop Yarn的架构和原理
「这是我参与11月更文挑战的第13天,活动详情查看:2021最后一次更文挑战」。 1. yarn的基本介绍和产生背景 YARN是Hadoop2引入的通用的资源管理和任务调度的平台,可以在YARN上运行
Hive的数据存储格式
Hive支持的数据格式主要有:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET。 左边图为逻辑表,右边第一个为行式存储,第二个为列式存储。 因为每个字段的数据聚集存储,在查询只需要少数几个字段的时候,能大大减少读取的数据量,每个字段的数据类型一定是相同的,列…