首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
五分钟学大数据
掘友等级
大数据工程师
|
公众号:五分钟学大数据
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 4
沸点 1
赞
5
返回
|
搜索文章
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
5月前
关注
Flink+Kafka存在诸多限制,下一代实时存储组件来解决!
内容分为以下五个部分: Kafka 在实时分析场景遇到的问题 Fluss:Flink Unified Streaming Storage Fluss 核心特性 Fluss ...
0
1
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
5月前
关注
阿里数据仓库-数据模型建设方法总结(全)
一、大数据领域建模综述 1.1 为什么需要数据建模 有结构地分类组织和存储是我们面临的一个挑战。 数据模型强调从业务、数据存取和使用角度合理存储数据。 数据模型方法,以便在...
2
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
5月前
关注
消除大数据处理的资源浪费,实现 90% 成本降低
Apache Spark 是⼀个专门为大规模数据处理设计的计算引擎,广泛应⽤于数据分析和机器学习等场景。随着 Spark 处理数据量的指数级增⻓,传统的固定资源池模式⾯临 ...
1
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
5月前
关注
Spark SQL 复杂类型高阶函数详解
背景 复杂类型的数据和真实数据模型相像,但是使用sql操作较为困难,一般需要借助于 explod/collect_list 等方法,或者使用 scala / python ...
0
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
9月前
关注
数仓面试中3个常考的SQL数据分析题
在数据类岗位招聘过程中,经常会考察求职者的SQL能力,这里整理了3个常考的SQL数据分析题,按照由简单到复杂排序,一起来测试一下你掌握了么?...
1
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
1年前
关注
大数据之数据治理体系全面指南
数据治理是企业数据建设必不可少的一个环节。 好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。如何构建企业数据治理体系?企...
3
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
2年前
关注
通俗易懂数仓建模—Inmon范式建模与Kimball维度建模
本文开始先简单理解两种建模的核心思想,然后根据一个具体的例子,分别使用这两种建模方式进行建模,大家便会一目了然! 一、两种建模思想 对于 Inmon 和 Kimball 两...
2
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
如何保障数仓数据质量?
导读 有赞数据报表中心为商家提供了丰富的数据指标,包括30+页面,100+数据报表以及400+不同类型的数据指标,它们帮助商家更合理、科学地运营店铺,同时也直接提供分析决策...
0
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
万字长文详解HBase读写性能优化
一、HBase 读优化 1. HBase客户端优化 和大多数系统一样,客户端作为业务读写的入口,姿势使用不正确通常会导致本业务读延迟较高实际上存在一些使用姿势的推荐用法,这...
0
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
Spark SQL底层执行流程详解
本文目录 一、Apache Spark 二、Spark SQL发展历程 三、Spark SQL底层执行原理 四、Catalyst 的两大优化 一、Apache Spark ...
0
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)
本文目录: 一、数据流向 二、应用示例 三、何为数仓DW 四、为何要分层 五、数据分层 六、数据集市 七、问题总结 导读 数仓在建设过程中,对数据的组织管理上,不仅要根据业...
1
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 下
虽然实时计算在最近几年才火起来,但是在早期也有部分公司有实时计算的需求,但是数据量比较少,所以在实时方面形成不了完整的体系...
3
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
最新大厂数据湖面试题,知识点总结
本文是一篇数据湖的面试题,同时也是数据湖知识点的讲解 目录: 一、什么是数据湖 二、数据湖的发展 三、数据湖有哪些优势 四、数据湖应该具备哪些能力 五、数据湖的实现遇到了哪...
0
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
数仓建设保姆级教程,离线和实时一网打尽(理论+实战)
数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 本文大纲: 因内容较多,带目录的PDF查看是比较方便的: 数仓建设保姆级教程PDF文档 一、数仓基本概念 1. 数据仓...
13
1
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
万字长文详解HiveSQL执行计划
本文目录: 一、前言 二、SQL的执行计划 explain 的用法 explain 的使用场景 案例一:join 语句会过滤 null 的值吗? 案例二:group by ...
1
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
万字详解数据仓库、数据湖、数据中台和湖仓一体
本文目录: 一、前言 二、概念解析 数据仓库 数据湖 数据中台 三、具体区别 数据仓库 VS 数据湖 数据仓库 VS 数据中台 总结 四、湖仓一体 目前数据存储方案 Dat...
7
2
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
详解大厂实时数仓建设
一、实时数仓建设背景 1. 实时需求日趋迫切 目前各大公司的产品需求和内部决策对于数据实时性的要求越来越迫切,需要实时数仓的能力来赋能。传统离线数仓的数据时效性是 T+1,...
14
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
详解数据中台的底层架构逻辑
数据中台到底是什么,几年过去了,也一直众说纷纭。 笔者认为数据中台不应该是一个单纯的系统或者是一个软件工具,而应该是一套架构、一套数据流转模式。 数据中台需要采集数...
4
评论
分享
五分钟学大数据
大数据工程师 @公众号:五分钟学大数据
·
3年前
关注
Hive SQL优化思路
Hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。 优化的核心思想是: 减少数据量(例如分区、列剪裁) 避...
1
评论
分享
下一页
个人成就
文章被点赞
211
文章被阅读
94,377
掘力值
3,335
关注了
1
关注者
228
收藏集
0
关注标签
1
加入于
2020-12-23