首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
武子康
掘友等级
后端工程师
永远好奇 无限进步
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
361
文章 251
沸点 110
赞
361
返回
|
搜索文章
赞
文章( 251 )
沸点( 110 )
大数据-249 离线数仓 - 电商分析 Hive 数仓实战:订单拉链表到 DWS 宽表设计与加载脚本详解
电商订单场景,拆解从 ODS → DWD → DWS 的订单链路设计。核心内容包括:订单主表为什么适合做 拉链表、如何按订单创建日期进行 分区设计、订单商品表在 DWD 明细层 的处理方式,以及如何在
大数据-248 离线数仓 - 电商分析 Hive 离线数仓维表设计实战:快照表、拉链表与 DIM 增量加载全流程
系统说明了 DIM 层建模 中两类常见方案:每日快照表 与 拉链表(SCD)。内容覆盖商品分类维表、商家地域组织维表、商品信息维表三类典型场景,重点讲清了 反范式宽表设计、ODS 到 DIM 的分层处
大数据-247 离线数仓 - 电商分析 Hive 拉链表实战:订单历史状态增量刷新、闭链逻辑与错误排查
Hive 拉链表、离线数仓、订单历史状态保存、增量刷新、ODS 到 DWD 分层 展开,结合 2020 年订单状态变更案例,说明为什么在数仓建模中,拉链表适合处理“记录会变化、又需要保留历史”的业务对
大数据-246 离线数仓 - 电商分析 Hive 拉链表实战:初始化、每日增量更新、回滚脚本与错误排查
离线数仓建模方式,实战讲解 Hive 拉链表实现方案,覆盖初始化装载、每日增量更新、历史版本闭链、Shell 调度脚本以及回滚恢复逻辑。示例围绕 userinfo 分区表与 userhis 拉链表展开
大数据-245 离线数仓 - 电商分析 Hive 拉链表入门实战:缓慢变化维 SCD 类型、建表加载与常见错误速查
缓慢变化维(SCD,Slowly Changing Dimensions)展开,系统梳理 SCD Type 0、1、2、3、4、6 的核心差异,并结合 Hive 离线数仓场景说明快照表与拉链表的适用边
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
围绕订单数、商品数、支付金额三大指标,按销售区域与商品类型(三级品类)拆解分析维度。基于 trade_orders、order_product、product_info、product_categor
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
DataX(mysqlreader + hdfswriter)将 MySQL 电商业务库按“全量/增量”两类策略抽取到 HDFS,并在 Hive 中以 dt=yyyy-mm-dd 进行分区管理。针对维
大数据-243 离线数仓 - 实战电商核心交易增量导入(DataX - HDFS - Hive 分区
使用 DataX(MySQLReader + HDFSWriter)从 MySQL 抽取订单表、订单明细表、产品信息表的日增量数据,落地到 HDFS,并以 dt=yyyy-MM-dd 目录实现分区化存
大数据-244 离线数仓 - Hive ODS 层建表与分区加载实战(DataX→HDFS→Hive)
通过 DataX 将 MySQL 数据同步到 HDFS 指定目录,再在 Hive 中创建 ODS 外部表(EXTERNAL TABLE),统一使用 dt 字符串分区,并以逗号作为字段分隔符。核心在于让
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
Hive 离线数仓广告业务的 ADS 层导数流程展开,演示如何在 2020 年业务分区数据基础上,使用 Shell 脚本完成 ADS 层装载,并借助阿里开源 DataX 将 HDFS 中的 Hive
下一页
个人成就
优秀创作者
文章被点赞
331
文章被阅读
33,500
掘力值
6,574
关注了
2
关注者
98
收藏集
0
关注标签
10
加入于
2019-11-11