首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
wen酱110586
更多收藏集
微信扫码分享
微信
新浪微博
QQ
425篇文章 · 0订阅
【大数据 & AI】Flink Agents 源码解读 --- (7) --- AgentsExecutionEnvironment
【大数据 & AI】Flink Agents 源码解读 --- (7) --- AgentsExecutionEnvironment 0x00 概要 0x01 基础知识 1.1 定义 1.2 功能 1
【大数据 & AI】Flink Agents 源码解读 --- (6) --- ActionTask
【大数据 & AI】Flink Agents 源码解读 --- (6) --- ActionTask 0x00 概要 0x01 基础知识 1.1 相关组件 1.2 ActionTask 1.3 Pyt
【大数据 & AI】Flink Agents 源码解读 --- (5) --- ActionExecutionOperator
【大数据 & AI】Flink Agents 源码解读 --- (5) --- ActionExecutionOperator 0x00 摘要 0x01 基础知识 1.1 总体架构 1.2 定义 1.
【大数据 & AI】Flink Agents 源码解读 --- (4) --- AgentPlan
【大数据 & AI】Flink Agents 源码解读 --- (4) --- AgentPlan 【大数据 & AI】Flink Agents 源码解读 --- (4) --- AgentPl
【大数据 & AI】Flink Agents 源码解读 --- (3) --- Agent
【大数据 & AI】Flink Agents 源码解读 --- (3) --- Agent 0x00 概要 0x01 核心抽象 1.1 Agent抽象 1.2 Action 抽象 1.3 资源抽象 1
大数据-232 离线数仓Hive 离线数仓新增与留存计算:DWS 明细 + ADS 汇总一套跑通
离线数仓(Hive)中“新增”“留存”的口径与落地实现,给出一套可直接复用的工程化方案:先计算新增,再基于新增计算留存。核心做法是维护一张“所有信息表(id, dt)”,dt 记录
大数据-231 离线数仓 Hive实战:DWD到DWS(日/周/月活跃会员)ADS 指标落地脚本与坑点
Hive 离线数仓口径:以“启动日志”为 DWD 明细,构建 DWS 主题汇总(dws_member_start_day / week / month),最终在 ADS 层输出活跃会员数(DAU
大数据-230 离线数仓-ODS层的构建 Hive 2.3.7 JSON 解析实战:UDF 取数组 + explode 展开 vs JsonSerDe 建表加载
Hive 离线数仓中的 JSON 数据处理,覆盖三类最常见需求:1)从 JSON 串中取数组字段并在 SQL 中 explode 展开;2)从 JSON 串中同时解析普通字段(json_tuple)
大数据-229 离线数仓ODS 层实战:Hive 外部表分区加载与 JSON 解析(get_json_object/json_tuple)
离线数仓(2026)中 ODS(Operational Data Store)层的工程落地,给出 Hive 外部表(external table)+ 按天分区(partition dt)承接原始日志的
大数据-228 离线数仓 Flume Taildir + 自定义 Interceptor:从 JSON 提取时间戳写入 HDFS 分区
Apache Flume 的离线日志采集链路,给出一套工程化落地:使用 Taildir Source 监控多个目录与多文件正则匹配,为不同目录日志注入 logtype 等 Header;通过自定义 I