首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
进击吧大数据
掘友等级
大数据开发
从事大数据行业多年,涉及范围包括不局限于基础支撑、计算引擎、数据整合、数据应用等多方向,参与过大型企业数仓体系建设、对数据建模、数据治理有一定的理解;目前带领团队建设企业实时数仓丰富化Flink底层引擎能力
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
开源面试题社区平台上线了
一款开源面试题社区,希望能够帮助到求职者们。22年的就业形势相信大家有自己的分析判断,个人唯独能做的就是提升自己。想到赵本山老师说过的一句话和大家共勉:没能力就说没能力,怎么你到哪儿,哪都环境不好,你
Flink从入门到放弃(四)-State初体验
一、回顾 经过前面几篇文章的整理,我们已经学习到了Flink框架的特性以及数据流处理模型中的前两个环节(source、transformation)。在transformation环节中,基于无界流的
大数据白皮书
这两天阅读了下中国信息通信研究院发布的《大数据白皮书(2020年)》,了解了下目前国内大数据的发展现状以及未来的趋势,笔者将该白皮书的一些重要内容画成了图的形式供大家参考,建议直接阅读白皮书,里面涉及
指标、标签傻傻分不清楚
概述 数仓建设中,指标和标签是可以直接体现数仓价值的两种形态。理解指标和标签的含义,以及两者之间的区别,对数仓建设有强的指导性意义。本文参考《人人都是产品经理》中对指标和标签的解读,结合自身的理解,从
Hive实现好友推荐
需求描述 在推荐业务场景中,会有些好友推荐的应用出现,例如现在的QQ好友推荐。那么在早些年头,关于共同好友的算法题是通过MR来实现的,也是大厂面试题中的一道。昨天跟朋友又聊到这道题目,讨论使用SQL如
元数据之-血缘分析实战
引入 做过大数据或者接触过数仓的同学,相信都有听到过数据治理、血缘分析的专业术语。不知道大家有没有思考过以下几个问题: 1、什么是血缘分析?主要分析什么东西? 2、为什么要做血缘分析,主要是为了解决什
Hive4.0新功能
Hive3.X在2020年正式发布,对于很多企业来说仍然停留在1.X,甚者在使用0.X版本中。即使如此,也不能阻止同学们学习的脚步。当然笔者相信仍然还有很多同学还没学习Hive3.X的新特性,那么没关
指标体系建设
概念 首先看一下百度百科对指标体系的解释:“指标体系指的是若干个相互联系的统计指标所组成的有机体”。它主要由指标和体系两部分组成。那么也就是将零散指标通过某种关系系统化的整合起来形成完整的一棵树。 指
Hive专题-数据倾斜定位篇
本篇仅以Hive为例,来分享下如何在事中定位到是否倾斜以及倾斜对应的key。对于如何定位到数据倾斜,大多数同学或许都是根据经验判断,可能对于某个reduce一直处于99%进度或者一个任务计算处理超过1
二十张图让你一分钟全面学习数仓建设之路
最近在做自我知识体系的梳理,进行查缺补漏。同时也在辅导几位同学学习数仓,如果写数仓专题的话,首先知识点比较多,而且比较抽象,文章更新频率会很慢。所以笔者结合以前学习的资料和大佬们写的文章,这里直接对整个数仓的建设以图的形式展现给大家,也不会特别详细,至少能够让大家对数仓有个整体…
下一页
个人成就
文章被点赞
16
文章被阅读
18,729
掘力值
472
关注了
8
关注者
23
收藏集
0
关注标签
27
加入于
2017-04-18