首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
LightGao
掘友等级
大数据
|
360数科
目前执职于360数科,大数据领域拥有8年的从业经验。欢迎关注我的微信公众号“大数据工坊”获取更多专业资讯和交流机会。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
38
文章 38
沸点 0
赞
38
返回
|
搜索文章
最新
热门
Flink实时数仓同步:实时表、流水表、快照表整合实战详解
在大数据领域,数据分析、实时数仓已经成为平台上常见的功能之一。无论是进行实时分析还是离线分析,都离不开数仓中的表数据。特别是在实时分析领域,查阅实时数据、历史数据以及历史变更数据是非常常见的需求。而这些功能的实现主要依赖于数仓中的实时表、流水表和快照表。本文将结合前几篇关于实时数...
Flink实时数仓同步:切片表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。[Mysql] 业务数据 - 假设我们有一个订单表(也称为事实表),记录了公司的销售订单信息。该表包含以下字段:订...
Flink实时数仓同步:实时表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同步存储方式包括离线仓库和实时仓库等,选择取决于业务需求和数据特性。根据上述需求,我们可以得出需要构建实时表以...
Flink实时数仓同步:快照表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同步存储方式包括离线仓库和实时仓库等,选择取决于业务需求和数据特性。看到这里,有些同学可能会疑惑为何不采用离线...
Flink实时数仓同步:流水表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同步存储方式包括离线仓库和实时仓库等,选择取决于业务需求和数据特性。一项常见需求是,大数据分析平台需要能够检索...
Flink实时数仓同步:拉链表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同步存储方式包括离线仓库和实时仓库等,选择取决于业务需求和数据特性。根据以上需求,业务人员希望既能够查看当天的...
数仓日常维护:剖析每日增量同步的内部机制
在现代企业中,离线仓库扮演着不可或缺的角色。它充当着一个数据的中心枢纽,存储和管理着海量的信息。作为企业数据分析、业务决策和预测的基石,离线仓库的重要性不言而喻。而数据的实时性和准确性对于确保数据仓库的有效性至关重要。而离线数仓中常见的数据同步方式是T+1,其中同步方式主要分为两...
深入数仓离线数据同步:问题分析与优化措施
在数据仓库领域,离线数仓和实时数仓是常见的两种架构类型。离线数仓一般通过定时任务在特定时间点(通常是凌晨)将业务数据同步到数据仓库中。这种方式适用于对数据实时性要求不高,更侧重于历史数据分析和报告生成的场景。然而,采用离线同步方式可能会引发业务数据与数据仓库数据不一致的问题。本文...
Flink实操:Flink SQL实现SFTP文件读写操作
公司需要将Doris数据库中的部分表数据同步至SFTP服务器,以供其他合作企业安全读取和使用。目前,平台数据同步功能统一使用Flink引擎进行实时同步、离线同步的工作。因此,希望能够充分利用现有的Flink引擎,并将其复用于这一需求。由于我们选择使用Flink引擎来实现需求,我们...
Java SPI解读:揭秘服务提供接口的设计与应用
在 Java 编程中,SPI(Service Provider Interface)是实现可插拔式应用的一种机制。它就像是应用程序的魔法盒,让你可以随时添加新的功能实现,而不需搞得一团糟。通过SPI,我们可以在运行时动态加载具体的服务实现,这意味着你的应用程序可以像变戏法一样,轻...
下一页
个人成就
文章被点赞
113
文章被阅读
20,958
掘力值
928
关注了
2
关注者
47
收藏集
0
关注标签
11
加入于
2019-11-14