首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
五分钟学大数据
掘友等级
大数据工程师
|
公众号:五分钟学大数据
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 4
沸点 1
赞
5
返回
|
搜索文章
最新
热门
HBase 调优详细剖析
「这是我参与11月更文挑战的第21天,活动详情查看:2021最后一次更文挑战」。 1. 通用优化 NameNode的元数据备份使用SSD。 定时备份NameNode上的元数据,每小时或者每天备份,如果
HBase 的协处理器详细剖析
「这是我参与11月更文挑战的第20天,活动详情查看:2021最后一次更文挑战」。 1. 起源 Hbase 作为列族数据库最经常被人诟病的特性包括:无法轻易建立“二级索引”,难以执行求和、计数、排序等操
HBase 的预分区及 rowkey 设计技巧
「这是我参与11月更文挑战的第19天,活动详情查看:2021最后一次更文挑战」。 一、HBase 的预分区 1. 为何要预分区? 增加数据读写效率 负载均衡,防止数据倾斜 方便集群容灾调度 regio
HBase 基础及核心架构解析
「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战」。 一、HBase 基础 1. HBase 基本介绍 简介 HBase 是 BigTable 的开源 Java 版本。是建
最强最全面的数仓建设规范指南(二)
「这是我参与11月更文挑战的第17天,活动详情查看:2021最后一次更文挑战」。 上节:最强最全面的数仓建设规范指南(一) 三、数仓各层开发规范 1. ODS层设计规范 同步规范: 一个系统源表只允许
最强最全面的数仓建设规范指南(一)
「这是我参与11月更文挑战的第16天,活动详情查看:2021最后一次更文挑战」。 目录: 一、数据模型架构原则 数仓分层原则 主题域划分原则 数据模型设计原则 二、数仓公共开发规范 层次调用规范 数据
Hive数据抽样与存储格式详解
「这是我参与11月更文挑战的第15天,活动详情查看:2021最后一次更文挑战」。 当数据规模不断膨胀时,我们需要找到一个数据的子集来加快数据分析效率。因此我们就需要通过筛选和分析数据集为了进行模式 &
Hive 架构与表类型
「这是我参与11月更文挑战的第14天,活动详情查看:2021最后一次更文挑战」。 一. Hive架构 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为
Hadoop Yarn的架构和原理
「这是我参与11月更文挑战的第13天,活动详情查看:2021最后一次更文挑战」。 1. yarn的基本介绍和产生背景 YARN是Hadoop2引入的通用的资源管理和任务调度的平台,可以在YARN上运行
一文读懂Hive数据存储格式
「这是我参与11月更文挑战的第12天,活动详情查看:2021最后一次更文挑战」。 本文讲解 Hive 的数据存储,是 Hive 操作数据的基础。选择一个合适的底层数据存储文件格式,即使在不改变当前 H
下一页
个人成就
文章被点赞
214
文章被阅读
102,699
掘力值
3,359
关注了
1
关注者
230
收藏集
0
关注标签
1
加入于
2020-12-23