首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
五分钟学大数据
掘友等级
大数据工程师
|
公众号:五分钟学大数据
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 4
沸点 1
赞
5
返回
|
搜索文章
最新
热门
Flink+Kafka存在诸多限制,下一代实时存储组件来解决!
内容分为以下五个部分: Kafka 在实时分析场景遇到的问题 Fluss:Flink Unified Streaming Storage Fluss 核心特性 Fluss 未来规划 Fluss 开源
阿里数据仓库-数据模型建设方法总结(全)
一、大数据领域建模综述 1.1 为什么需要数据建模 有结构地分类组织和存储是我们面临的一个挑战。 数据模型强调从业务、数据存取和使用角度合理存储数据。 数据模型方法,以便在性能、成本、效率之间取得最佳
消除大数据处理的资源浪费,实现 90% 成本降低
Apache Spark 是⼀个专门为大规模数据处理设计的计算引擎,广泛应⽤于数据分析和机器学习等场景。随着 Spark 处理数据量的指数级增⻓,传统的固定资源池模式⾯临 30-50% 的资源浪费,主
Spark SQL 复杂类型高阶函数详解
背景 复杂类型的数据和真实数据模型相像,但是使用sql操作较为困难,一般需要借助于 explod/collect_list 等方法,或者使用 scala / python 编写UDF,但是对每个方法都
数仓面试中3个常考的SQL数据分析题
在数据类岗位招聘过程中,经常会考察求职者的SQL能力,这里整理了3个常考的SQL数据分析题,按照由简单到复杂排序,一起来测试一下你掌握了么?
大数据之数据治理体系全面指南
数据治理是企业数据建设必不可少的一个环节。 好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。如何构建企业数据治理体系?企业数据治理过程需要注意哪些问
通俗易懂数仓建模—Inmon范式建模与Kimball维度建模
本文开始先简单理解两种建模的核心思想,然后根据一个具体的例子,分别使用这两种建模方式进行建模,大家便会一目了然! 一、两种建模思想 对于 Inmon 和 Kimball 两种建模方式可以长篇大论叙述,
如何保障数仓数据质量?
导读 有赞数据报表中心为商家提供了丰富的数据指标,包括30+页面,100+数据报表以及400+不同类型的数据指标,它们帮助商家更合理、科学地运营店铺,同时也直接提供分析决策方法供商家使用。并且,每天在
万字长文详解HBase读写性能优化
一、HBase 读优化 1. HBase客户端优化 和大多数系统一样,客户端作为业务读写的入口,姿势使用不正确通常会导致本业务读延迟较高实际上存在一些使用姿势的推荐用法,这里一般需要关注四个问题: 1
Spark SQL底层执行流程详解
本文目录 一、Apache Spark 二、Spark SQL发展历程 三、Spark SQL底层执行原理 四、Catalyst 的两大优化 一、Apache Spark Apache Spark是用
下一页
个人成就
文章被点赞
203
文章被阅读
89,462
掘力值
3,292
关注了
1
关注者
219
收藏集
0
关注标签
1
加入于
2020-12-23