Flink+ClickHouse 玩转企业级实时大数据开发MK

339 阅读1分钟

Download:百度网盘

提取码:45on

何跟一个非相关性的人解释你是做大数据的,你是做大数据的哪一部分工作,从求职者角度,如何从jd描述中估摸大概率做哪一块,从猎头角度,如何从一份简历中看出你更匹配哪个jd 1.相关技术 大数据开发的技术名词无非是下面几种,

Hadoop,Hive,Spark,Kafka,Sqoop,Flink,Oozie,Hbase,hue

但是大数据架构根据每个厂的基础建设不同,可能会有不同的方案,但是总的流程是大致一致的

涉及的语言一般是:Java, Scala, Python, Go 其中前两者是必须掌握的主语言,后两者是平台或者业务多

2.流程 粗略地来讲,应用角度,最终有两种服务去向,一种是返回给用户,一种是做业务决策,虽说业务决策最终大概率也是返回给用户,但是这是一个隐含的很长的链,所以假设不考虑这个,返给用户又包括:实时返回,定时返回,运营结果返回,

sfefwewewwe.png 其他就是辅助上面数据流转的框架引擎,监控系统等等,调度系统

数据采集 自己后台业务数据,埋点数据,第三方数据

数据同步 将业务数据库数据或者kafka等日志拉到数仓

数据开发 将原始ods层数据根据数仓划分一层层加工

数据展示 将最后的数据再导入到业务数据库

3.岗位分类 基础平台团队 主要负责搭建稳定、可靠的大数据存储和计算平台。