首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
BIGDATA
订阅
旭杰夏
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
美团DB数据同步到数据仓库的架构与实践
在数据仓库建模中,未经任何加工处理的原始业务层数据,我们称之为ODS(Operational Data Store)数据。在互联网企业中,常见的ODS数据有业务日志数据(Log)和业务DB数据(DB)两类。对于业务DB数据来说,从MySQL等关系型数据库的业务数据进行采集,然后…
Hive数据仓库你了解了吗
Hive基本概念什么是Hive为什么使用Hive直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短MapReduce实现复杂查询逻辑开发难度太大为什么要使用Hive操作接口采用类SQL语
No.16 【漫谈数据仓库】 拉链表
数据仓库部署和运维
本文档将展示如何部署数据仓库以及简单展示其使用场景和方式。 Airflow是一个编排、调度和监控workflow的平台,由Airbnb开源,现在在Apache Software Foundation 孵化。airflow 将workflow编排为tasks组成的DAGs,调度器…
数据仓库学习笔记(二)
这一系列主要是美团18年一年的大数据相关的文章分享,倒序。 从中可以看到美团的实时数据系统架构从Storm到Flink的转变和选择。 数据指标越来越多,“烟囱式”的开发导致代码耦合问题严重。 需求越来越多,有的需要明细数据,有的需要 OLAP 分析。单一的开发模式难以应付多种需…
初识Airflow任务调度平台
分布式系统可能运行在一个集群上,也可能运行在不属于一个集群的多台(2台也算是多台)机器上。 Airflow是Airbnb开源的一个用Python编写的调度工具。 概要:DAG(Directed Acyclic Graph)是有向无环图,也称为有向无循环图。在Airflow中,一…
Airflow[v1.10]任务调度平台的安装教程
真的是想不通,Airflow不论社区活跃度还是Github的star数都是远胜于Azkaban还有EasyScheduler的,但是为何却连一个完备的安装教程都没有呢?是我的需求太高?真的是心累不已,整整把搜索引擎还有youtube翻来覆去也没让我感到满足……不过好在,一步一坑…
设计一个分布式RPC框架
提前先祝大家春节快乐!好了,先简单聊聊。 我从事的是大数据开发相关的工作,主要负责的是大数据计算这块的内容。最近Hive集群跑任务总是会出现Thrift连接HS2相关问题,研究了解了下内部原理,突然来了兴趣,就想着自己也实现一个RPC框架,这样可以让自己在设计与实现RPC框架过…
基于Hadoop的数据仓库
不了解的数据仓库基本概念的,可以参考之前《了解一下数据仓库》这篇文章。