首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
LightGao
掘友等级
大数据
|
360数科
目前执职于360数科,大数据领域拥有8年的从业经验。欢迎关注我的微信公众号“大数据工坊”获取更多专业资讯和交流机会。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
38
文章 38
沸点 0
赞
38
返回
|
搜索文章
LightGao
大数据 @360数科
·
1年前
关注
数据仓库表设计理论
增量更新数据源是指允许新增、修改和删除操作的数据源。数据可修改:可以对历史数据进行修改、覆盖,以反映数据的变更。实时性高:由于数据可以随时更新,具有很强的实时性和即时性。常...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
深度探究依赖冲突 NoSuchMethodError 问题解决之道
由于公司parent-pom.2023-10-26 14:09:24.555 ERROR [main] [tid:TID: N/A|req:|cip:|channel:] ...
6
1
分享
LightGao
大数据 @360数科
·
1年前
关注
Git 与 Maven:企业级版本管理与版本控制规范设计
当今,许多开发人员熟悉 GitFlow 工作流程,但往往忽略了 GitFlow 如何与 Maven 版本控制结合,尤其是在管理 snapshot 和 release 版本时...
4
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Python虚拟环境指南:告别依赖地狱
在SAAS(软件即服务)平台中,用户使用自行定制的Python脚本已经成为司空见惯的做法,然而,由于不同用户对Python三方库的需求各不相同,而底层服务器一般只安装了一个...
6
1
分享
LightGao
大数据 @360数科
·
1年前
关注
轻松操纵SQL:Druid解析器实践
在BI(Business Intelligence)场景中,用户会频繁使用SQL查询语句,但在平台运作过程中,面临着权限管理、多数据源处理和表校验等多种挑战。例如,用户可能...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
解码 SQL:深入探索 Antlr4 语法解析器背后的奥秘
在数据领域,SQL(Structured Query Language)是一门广泛使用的语言,用于查询和处理数据。你可能已经使用过诸如MySQL、Hive、ClickHou...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:实时表、流水表、快照表整合实战详解
在大数据领域,数据分析、实时数仓已经成为平台上常见的功能之一。无论是进行实时分析还是离线分析,都离不开数仓中的表数据。特别是在实时分析领域,查阅实时数据、历史数据以及历史变...
10
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:切片表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。[My...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:实时表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同...
4
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:快照表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同...
7
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:流水表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同...
3
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实时数仓同步:拉链表实战详解
在大数据领域,初始阶段业务数据通常被存储于关系型数据库,如MySQL。然而,为满足日常分析和报表等需求,大数据平台采用多种同步方式,以适应这些业务数据的不同存储需求。这些同...
3
2
分享
LightGao
大数据 @360数科
·
1年前
关注
数仓日常维护:剖析每日增量同步的内部机制
在现代企业中,离线仓库扮演着不可或缺的角色。它充当着一个数据的中心枢纽,存储和管理着海量的信息。作为企业数据分析、业务决策和预测的基石,离线仓库的重要性不言而喻。而数据的实...
4
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
深入数仓离线数据同步:问题分析与优化措施
在数据仓库领域,离线数仓和实时数仓是常见的两种架构类型。离线数仓一般通过定时任务在特定时间点(通常是凌晨)将业务数据同步到数据仓库中。这种方式适用于对数据实时性要求不高,更...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Flink实操:Flink SQL实现SFTP文件读写操作
公司需要将Doris数据库中的部分表数据同步至SFTP服务器,以供其他合作企业安全读取和使用。目前,平台数据同步功能统一使用Flink引擎进行实时同步、离线同步的工作。因此...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
Java SPI解读:揭秘服务提供接口的设计与应用
在 Java 编程中,SPI(Service Provider Interface)是实现可插拔式应用的一种机制。它就像是应用程序的魔法盒,让你可以随时添加新的功能实现,而...
3
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
产品SDK化转型:标准化与机构个性化定制解决方案
在互联网行业中,企业通常可分为两大类别:2C和2B。对于2B企业而言,它们的产品往往以产品的形式提供给各个合作机构。以金融领域为例,一家2B金融公司通常将产品销售给各个银行...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
数据仓库表设计理论
前言 数仓顾名思义是数据仓库,其数据来源大多来自于业务数据(例如:关系型数据库),当设计数仓中表类型时(拉链表、增量表、全量表、流水表、切片表)时,应先观察业务数据的特点再...
2
评论
分享
LightGao
大数据 @360数科
·
1年前
关注
探寻SQL的背后机制
探寻SQL的背后机制 前言 在数据领域,SQL(Structured Query Language)是一门广泛使用的语言,用于查询和处理数据。你可能已经使用过诸如MySQL...
1
评论
分享
下一页
个人成就
文章被点赞
115
文章被阅读
24,379
掘力值
937
关注了
2
关注者
47
收藏集
0
关注标签
11
加入于
2019-11-14