网易各条产品线林立:
- 网易云音乐:推荐点击、播放、评论
- 网易游戏:充值、活跃、流失
- 网易电商:订单、退款、转化
- 网易邮箱、教育、LOFTER 等
如何让不同业务说“一个数据语言” ,实时准确地衡量关键指标?网易答案是:
建统一数据中台:标准指标体系 + 实时数仓 + 语义建模平台 + 多端一致输出。
一、网易数据中台架构总览图
二、统一指标体系:不再“一个 DAU 三个版本”
网易强调**“一指标、一定义、一口径”**原则,解决常年存在的“数据口径不一致”问题。
指标注册机制:
所有关键指标必须注册到统一指标中心,包括:
| 字段 | 示例 |
|---|---|
| 指标名 | dau_active_user |
| 维度 | 端类型 / 渠道 / 地区 |
| 粒度 | 天/小时 |
| 说明 | “用户当天至少一次启动 App” |
| 计算逻辑 | 去重逻辑、数据来源表等 |
| 所属负责人 | XXX@corp.netease.com |
✅ 所有产品团队调用指标,只能通过中心接口:
SELECT dau_active_user
FROM metrics_service
WHERE date = '2025-06-04' AND app = '网易云音乐'
三、数据建模体系:ODS → DWD → DWS → ADS 四层法则
网易构建一套清晰的数据建模标准:
| 层级 | 缩写 | 描述 |
|---|---|---|
| 源表层 | ODS | 原始数据落地(如 raw_log) |
| 明细层 | DWD | 业务过程明细,如用户行为、交易 |
| 汇总层 | DWS | 各维度统计指标,如每日 DAU/支付人数 |
| 应用层 | ADS | 给 BI/运营直接使用的宽表 |
示例:用户支付路径建模
ODS:log_event_user_pay →
DWD:dwd_user_payment_detail →
DWS:dws_user_payment_summary →
ADS:ads_user_ltv_by_channel
✅ 建模规范全程通过 Git + 审批制度统一托管,防止口径漂移。
四、实时数仓:Flink + Kafka + Hudi 实现秒级分析
网易实时数仓特点:
- Kafka 采集全埋点日志
- Flink 实时流处理,输出到 Kafka Topic + Hudi
- Hudi 表支持实时读写 + 小文件合并
- 支持 Kafka Topic -> FlinkSQL -> Hudi -> Superset 可视化全链路
示例:1分钟更新 DAU 指标
CREATE TABLE dau_realtime (
user_id STRING,
device_id STRING,
event_time TIMESTAMP,
...
) WITH (
'connector' = 'kafka',
'topic' = 'log_user_action',
...
)
INSERT INTO metrics_dau_hourly
SELECT COUNT(DISTINCT user_id), HOUR(event_time)
FROM dau_realtime
GROUP BY HOUR(event_time)
五、语义建模平台:业务 + 数据 “说一样的语言”
网易自研语义建模平台支持:
- 模块化建模(指标 = 事实表 + 维度 + 过滤条件)
- 可视化拖拽配置逻辑表达式
- 每个业务线都可以注册自己的“数据语义包”(如电商包、游戏包)
示例:
注册指标 新增付费用户数:
- 事实表:
dwd_user_payment_detail - 维度:注册时间 within X 天
- 过滤条件:首单支付
- 输出粒度:按小时聚合
然后就可以在所有 BI 工具中复用:
select * from metrics_pkg_game.new_user_paid_1d
六、数据服务平台:API / SQL / 多端输出
网易支持多种数据服务方式:
| 输出方式 | 用途 |
|---|---|
| API 服务 | 小程序 / APP 实时看板 |
| SQL 查询 | 供数据分析师灵活使用 |
| BI 报表 | Superset + 自研可视化平台 |
| 数据探查 | 异常监控 + 回溯 |
| 订阅推送 | 钉钉、企业微信日报 / 周报 |
七、真实指标成果(网易云音乐 + 网易游戏)
| 指标 | 延迟 | 准确率 | 使用人群 |
|---|---|---|---|
| 实时 DAU | <60s | 99.9% | 300+ 产品/运营 |
| 实时 GMV | <30s | 99.8% | 电商/游戏部门 |
| 用户行为链路 | 5分钟内可视 | 精准 | 风控/推荐系统 |
彩蛋:
“真正统一的数据,不是存在一个地方,而是任何人都能‘说得一样’。”