首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据技术派
掘友等级
大数据开发
公众号:大数据技术派
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
204
文章 187
沸点 17
赞
204
返回
|
搜索文章
赞
文章( 187 )
沸点( 17 )
Flink同步Kafka数据到ClickHouse分布式表
文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 业务需要一种OLAP引擎,可以做到实时写入存储和查询计算功能,提供高效、稳健的实时数据服务,最终决定Clic
Python常用基础语法知识点大全
介绍 Python 是一门独特的语言,快速浏览一下他的要点: 面向对象:每一个变量都是一个类,有其自己的属性(attribute)与方法(method)。 语法块:用缩进(四个空格)而不是分号、花括号
数仓建模—埋点设计与管理
数据仓库系列文章(部分已出,持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系统
数据湖是谁?那数据仓库又算什么?
刀光剑影江湖情,摧枯拉朽浪滔滔。功名利禄拂衣去,山高水远路迢迢。 数据湖初识 近两年,为什么都开始谈论起 Data Lake 这个”新名词”了?
数仓建模—指标体系
指标体系 提起指标这个词,每个人似乎都可以说出几个指标,像经常在工作中会听到的日活、月活、注册率、转化率、交易量等 事实上指标就是用来量化事物的一个工具,帮助我们去将一些抽象的事件得出一个轮廓上的描述
数仓建模—宽表的设计
[TOC] 宽表的设计 其实宽表是数仓里面非常重要的一块,前面我们介绍过了维度表事实表,今天我们介绍一下宽表,前面我们说过了数仓是分层的,这是技术进步和时代变化相结合的产物,数仓的分层式为了更好地管理
Spark SQL知识点详解与实战
Spark SQL概述 1、什么是Spark SQL Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 与基本的Spark RDD API不同,Sp
Hive实战UDF 外部依赖文件找不到的问题
[TOC] 其实这篇文章的起源是,我司有数据清洗时将ip转化为类似中国-湖北-武汉地区这种需求。由于ip服务商提供的Demo,只能在本地读取,我需要将ip库上传到HDFS分布式存储,每个计算节点再从H
Spark面试题(二)
## Spark系列面试题 - [Spark面试题(一)](https://www.ikeguang.com/?p=1922) - [Spark面试题(二)](https://www.ikeguang
下一页
个人成就
文章被点赞
797
文章被阅读
148,848
掘力值
4,646
关注了
15
关注者
299
收藏集
1
关注标签
11
加入于
2019-03-15