网易数据中台揭秘:统一指标 + 实时数仓 + 业务建模的“三板斧”是怎么落地的?

215 阅读3分钟

网易各条产品线林立:

  • 网易云音乐:推荐点击、播放、评论
  • 网易游戏:充值、活跃、流失
  • 网易电商:订单、退款、转化
  • 网易邮箱、教育、LOFTER 等

如何让不同业务说“一个数据语言” ,实时准确地衡量关键指标?网易答案是:

建统一数据中台:标准指标体系 + 实时数仓 + 语义建模平台 + 多端一致输出。


一、网易数据中台架构总览图

image.png


二、统一指标体系:不再“一个 DAU 三个版本”

网易强调**“一指标、一定义、一口径”**原则,解决常年存在的“数据口径不一致”问题。

指标注册机制:

所有关键指标必须注册到统一指标中心,包括:

字段示例
指标名dau_active_user
维度端类型 / 渠道 / 地区
粒度天/小时
说明“用户当天至少一次启动 App”
计算逻辑去重逻辑、数据来源表等
所属负责人XXX@corp.netease.com

✅ 所有产品团队调用指标,只能通过中心接口:

SELECT dau_active_user 
FROM metrics_service
WHERE date = '2025-06-04' AND app = '网易云音乐'

三、数据建模体系:ODS → DWD → DWS → ADS 四层法则

网易构建一套清晰的数据建模标准:

层级缩写描述
源表层ODS原始数据落地(如 raw_log)
明细层DWD业务过程明细,如用户行为、交易
汇总层DWS各维度统计指标,如每日 DAU/支付人数
应用层ADS给 BI/运营直接使用的宽表

示例:用户支付路径建模

ODS:log_event_user_pay →  
DWD:dwd_user_payment_detail →  
DWS:dws_user_payment_summary →  
ADS:ads_user_ltv_by_channel

✅ 建模规范全程通过 Git + 审批制度统一托管,防止口径漂移。


四、实时数仓:Flink + Kafka + Hudi 实现秒级分析

网易实时数仓特点:

  • Kafka 采集全埋点日志
  • Flink 实时流处理,输出到 Kafka Topic + Hudi
  • Hudi 表支持实时读写 + 小文件合并
  • 支持 Kafka Topic -> FlinkSQL -> Hudi -> Superset 可视化全链路

示例:1分钟更新 DAU 指标

CREATE TABLE dau_realtime (
  user_id STRING,
  device_id STRING,
  event_time TIMESTAMP,
  ...
) WITH (
  'connector' = 'kafka',
  'topic' = 'log_user_action',
  ...
)

INSERT INTO metrics_dau_hourly
SELECT COUNT(DISTINCT user_id), HOUR(event_time)
FROM dau_realtime
GROUP BY HOUR(event_time)

五、语义建模平台:业务 + 数据 “说一样的语言”

网易自研语义建模平台支持:

  • 模块化建模(指标 = 事实表 + 维度 + 过滤条件)
  • 可视化拖拽配置逻辑表达式
  • 每个业务线都可以注册自己的“数据语义包”(如电商包、游戏包)

示例:

注册指标 新增付费用户数

  • 事实表:dwd_user_payment_detail
  • 维度:注册时间 within X 天
  • 过滤条件:首单支付
  • 输出粒度:按小时聚合

然后就可以在所有 BI 工具中复用:

select * from metrics_pkg_game.new_user_paid_1d

六、数据服务平台:API / SQL / 多端输出

网易支持多种数据服务方式:

输出方式用途
API 服务小程序 / APP 实时看板
SQL 查询供数据分析师灵活使用
BI 报表Superset + 自研可视化平台
数据探查异常监控 + 回溯
订阅推送钉钉、企业微信日报 / 周报

七、真实指标成果(网易云音乐 + 网易游戏)

指标延迟准确率使用人群
实时 DAU<60s99.9%300+ 产品/运营
实时 GMV<30s99.8%电商/游戏部门
用户行为链路5分钟内可视精准风控/推荐系统

彩蛋:

“真正统一的数据,不是存在一个地方,而是任何人都能‘说得一样’。”