内容来源:宜信技术学院第11期技术沙龙|宜信数据中台全揭秘(一)数据中台整体介绍
主讲人:宜信数据中台解决方案架构师 裴国强
PPT下载:链接: pan.baidu.com/s/1eSkSdUo6… 密码: 99uh
一、数据中台定位
1.1 ADX整体简介-中台定位

-
企业级:针对是整个企业的所有业务部门,横向贯穿整个业务线的数据,纵向贯穿整个数据生命周期,从最开始的数据采集(DB,日志,消息,文件),入湖,标准化,开发(批量作业,流式作业)维度表,最后到数据服务和数据应用。
-
复用:复用的范围包括,能力的复用,逻辑的复用,数据资产的复用,算法的复用。
-
能力:对平台能力进行抽象,对于不同平台的对能力的抽象,业务平台(流程控制,管理,审批,权限「等级,继承」,调度),数据平台(批量,流式,UDF,UDAF,数据质量,血缘分析,数据地图,调度,数据资产管理,权限,数据服务)。
分横向和纵向两个方面:

横向划分
-
大数据基础集群:更贴近硬件的平台,负责提供稳定及高可用的计算运行环境,及安全的数据存储环境
-
HDFS-数据湖的基础存储,存放表每天的快照,和增量数据。
-
KUDU-最新快照,用于即席查询,数据服务,流式数据快照。
-
ClickHouse-Clickhouse做DW和DM层的存储。
-
数据中台 :对数据能力的抽象 ,数据的流式和批量加工,数据资产的发布,数据统一落湖,质量管理检测,脱敏加密,统一数据出口能力。
-
业务前台:对业务系统,业务线数据团队,提供各种不同的数据能力。使其能在中台上沉淀企业级数据资产。
纵向划分
-
数据管理委员会:对数据资产的质量认证,数据使用权限的授权,数据治理项目推动实施。
-
数据运营团队:客户标签,用户画像,产品画像,智能推荐,精细化管理。
-
数据安全团队:数据脱敏加密,安全密钥管控,数据风险的控制。
二、数据中台价值
2.1 数据中台价值

- 快:
传统数仓定制化报表,排期周期长,响应需求慢,重复开发工作比较多。T+1的数据失效也满足不了现在互联网业务场景下对数据实时处理能力的需求。对中台平台自主化开发,可以提升数据加工能力沉淀,以及实时数据处理能力。
- 准:
数据获取准确性,通过统一数据抽取平台对数据实时抽取,同时完成标准化,入湖,脱敏发布。通过元数据和血缘分析准确获取数据地图。通过模型管理和统一模型口径。
- 省:
节省人力成本,大大降低大数据处理的技术门槛,使用户能够快速上手。节省需求排期时间,使数据能更快的响应业务需求。节省硬件资源,通过对平台资源的整合,规划,节省硬件使用维护成本。
2.2 数据总线平台DBus

2.3 流式处理平台Wormhole

Wormhole面向大数据项目开发和管理运维人员,致力于提供数据流式处理解决方案。平台专注于简化和统一开发管理流程,提供可视化的操作界面,基于配置和SQL的业务开发方式,屏蔽底层技术实现细节,极大降低了开发门槛,使得大数据流式处理项目的开发和管理变得更加轻量敏捷、可控可靠。
2.4 虚拟混算服务平台Moonbox

2.5 数据化可视应用平台Davinci

三、数据中台模块架构
3.1 数据中台模块架构

3.2 功能目录

四、解决核心问题概览
4.1 批量作业处理

- 批量作业、流式作业拖拽式编排
- 批量作业、流式作业SQL式开发
- 全局唯一表名,屏蔽异构数据系统
- 开发期可验证SQL和数据正确性
4.2 流式作业处理

后面的沙龙我们将详细的介绍宜信数据中台的批量处理和流式处理功能请大家持续关注我们。