首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
五分钟学大数据
掘友等级
大数据工程师
|
公众号:五分钟学大数据
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 4
沸点 1
赞
5
返回
|
搜索文章
最新
热门
数仓建设保姆级教程,离线和实时一网打尽(理论+实战)
本文大纲: 因内容较多,带目录的PDF查看是比较方便的: 数仓建设保姆级教程PDF文档 一、数仓基本概念 1. 数据仓库架构 我们在谈数仓之前,为了让大家有直观的认识,先来谈数仓架构,“架构”是什么?
万字详解 Spark 数据倾斜及解决方案
本文目录: 一、调优概述 二、数据倾斜发生时的现象 三、数据倾斜发生的原理 四、如何定位导致数据倾斜的代码 五、某个task执行特别慢的情况 六、某个task莫名其妙内存溢出的情况 七、查看导致数据倾
数仓开发详细剖析
「这是我参与11月更文挑战的第29天,活动详情查看:2021最后一次更文挑战」。 1. 数据各层作用 ODS(原始数据层) :日志数据和业务进入数仓后,首先放入该层,建立分区表,防止后续的全表扫描,使
消息队列(如 Kafka 等)的应用场景
「这是我参与11月更文挑战的第28天,活动详情查看:2021最后一次更文挑战」。 消息队列在实际应用中包括如下四个场景: 应用耦合:多应用间通过消息队列对同一消息进行处理,避免调用接口失败导致整个
Hadoop企业级生产调优手册(二)
「这是我参与11月更文挑战的第27天,活动详情查看:2021最后一次更文挑战」。 上节:Hadoop企业级生产调优手册(一) 五、HDFS存储优化 注:演示纠删码和异构存储需要一共 5 台虚拟机。尽量
Hadoop企业级生产调优手册(一)
「这是我参与11月更文挑战的第26天,活动详情查看:2021最后一次更文挑战」。 一、HDFS核心参数 1.1 NameNode内存生产配置 1. NameNode 内存计算 每个文件块大概占用 15
ETL工具算法构建企业级数据仓库五步法
「这是我参与11月更文挑战的第25天,活动详情查看:2021最后一次更文挑战」。 01 什么是ETL? ETL是数据抽取(Extract)、转换(Transform)、加载(Load )的简写,它是
基于 Flink 搭建实时平台
「这是我参与11月更文挑战的第24天,活动详情查看:2021最后一次更文挑战」。 一、前言 在大数据时代,金融科技公司通常借助消费数据来综合评估用户的信用和还款能力。这个过程中,某些中介机构会搜集大量
Redis 实现限流的三种方式
「这是我参与11月更文挑战的第23天,活动详情查看:2021最后一次更文挑战」。 面对越来越多的高并发场景,限流显示的尤为重要。当然,限流有许多种实现的方式,Redis具有很强大的功能,我用Redis
基于 OneData 的数据仓库方法论
「这是我参与11月更文挑战的第22天,活动详情查看:2021最后一次更文挑战」。 OneData 是阿里巴巴内部进行数据整合和管理方法体系和工具。 指导思想 首先,要进行充分的业务调研和需求分析。 其
下一页
个人成就
文章被点赞
213
文章被阅读
98,277
掘力值
3,348
关注了
1
关注者
227
收藏集
0
关注标签
1
加入于
2020-12-23