获得徽章 0
[灵光一现] 大数据-231 离线数仓 Hive实战:DWD到DWS(日/周/月活跃会员)ADS 指标落地脚本与坑点
评论
[灵光一现] 大数据-230 离线数仓-ODS层的构建 Hive 2.3.7 JSON 解析实战:UDF 取数组 + explode 展开 vs JsonSerDe 建表加载
评论
[灵光一现] 大数据-229 离线数仓ODS 层实战:Hive 外部表分区加载与 JSON 解析(get_json_object/json_tuple)
评论
[灵光一现] 大数据-228 离线数仓 Flume Taildir + 自定义 Interceptor:从 JSON 提取时间戳写入 HDFS 分区
评论
[灵光一现] 大数据-227 离线数仓-Flume 1.9.0 自定义拦截器实战:TAILDIR 多目录采集,按 logtime/logtype 写入 HDFS 分区
评论
[灵光一现] 大数据-226 离线数仓Flume 优化配置实战:batchSize/Channel/压缩/自定义拦截器与 OOM 修复
评论
[灵光一现] 大数据-225 离线数仓 会员指标实战:Flume Taildir HDFS ODS/DWD/DWS/ADS 全链路落地
评论
[灵光一现] 大数据-224 离线数仓 架构怎么选型与估算集群规模:Apache vs CDH/HDP,全组件清单+命名规范
评论
[灵光一现] 大数据-223 离线数仓怎么建:埋点→指标体系→主题分析任务,全链路落地指南
评论
[灵光一现] 大数据-222 离线数仓建模实战:事实表/维度表、三类事实表与雪花/星座模型
评论
下一页
个人成就
优秀创作者
文章被点赞 311
文章被阅读 27,026
掘力值 6,042
收藏集
0
关注标签
10
加入于