1. 背景
在传统企业后端架构里,数据通常采用 集中式数据湖 / 数据仓库:
- 业务系统 → 数据抽取(ETL/ELT) → 集中式大数据平台(Hive、Spark、Snowflake)
- 数据分析团队统一管理所有数据资产
这种模式的问题是:
- 单点瓶颈:所有数据都汇聚到一个平台,性能和扩展性受限
- 数据孤岛:不同业务线数据标准不统一,跨域难协作
- 团队壁垒:后端开发与数据团队分离,沟通成本高
- 交付慢:数据产品上线往往需要经过漫长流程
👉 为了解决这些问题,数据网格(Data Mesh) 概念被提出。
2. 什么是数据网格?
数据网格(Data Mesh)是一种 去中心化的数据架构理念,核心思想是:
- 把数据视为 产品(Data as a Product)
- 由 业务领域团队(Domain Team) 负责自己数据的生产、管理与服务化
- 通过统一的 平台能力(治理、安全、可观测性)支撑数据的跨域流通
简而言之,数据网格就是:
👉 像微服务一样管理数据。
3. 数据网格的四大原则
3.1 领域驱动的数据所有权(Domain Ownership)
每个业务域负责自己的数据产品:
- 订单域提供订单数据服务
- 用户域提供用户数据服务
- 营销域提供活动数据服务
3.2 数据即产品(Data as a Product)
数据不是“副产物”,而是对外提供的产品:
- 有清晰的 接口(API/SQL/GraphQL)
- 有质量保障(SLA、完整性、准确性)
- 有可观测性(监控、告警)
3.3 自助式数据平台(Self-Serve Data Platform)
需要一套基础设施来支持:
- 数据采集与存储
- 数据流管理(Kafka、Pulsar、Flink)
- 数据安全与访问控制
- 元数据管理(Data Catalog)
3.4 联邦治理(Federated Governance)
不是放任自流,而是有统一标准:
- 数据格式、命名规范
- 安全与合规(GDPR、数据脱敏)
- 访问策略(RBAC、ABAC)
4. 技术落地
4.1 基础设施层
- 存储:数据湖(Iceberg、Delta Lake)、云存储(S3、OSS)
- 计算:流处理(Flink)、批处理(Spark)、查询引擎(Presto/Trino)
- 消息总线:Kafka、Pulsar
4.2 平台层
- 数据目录(Data Catalog)
- 数据血缘(Data Lineage)
- 数据质量检测(Great Expectations)
- 访问治理(OPA、Ranger)
4.3 产品层
- 每个业务域提供 数据服务化 API
- 例如:订单域提供
GET /orders/{id}API,或者 SQL/GraphQL 接口
5. 应用场景
5.1 大型互联网公司
- 多业务线(电商、支付、广告),数据网格让团队各自负责,减少集中瓶颈。
5.2 金融行业
- 风控、交易、清算等不同业务域,要求数据实时共享且合规。
5.3 SaaS 平台
- 每个模块的数据都可以作为产品对外提供,支持 BI、AI、API 调用。
6. 数据网格 vs 传统数据平台
| 特性 | 集中式数据湖/仓库 | 数据网格 |
|---|---|---|
| 架构模式 | 中央团队统一管理 | 去中心化,领域团队负责 |
| 数据交付速度 | 慢 | 快(领域内自治) |
| 数据质量 | 依赖中央团队治理 | 产品化思维,领域自担 |
| 扩展性 | 单平台瓶颈 | 按业务域横向扩展 |
7. 挑战
- 团队能力要求高:业务团队需要具备数据工程能力
- 治理复杂度高:跨域标准化与合规难度大
- 工具链不成熟:目前落地工具还在快速发展中
8. 总结
数据网格正在成为后端数据架构的新范式:
- 从集中走向分布(像微服务替代单体一样)
- 从数据副产物走向数据产品
- 从被动治理走向主动自治
未来,大规模企业的数据体系很可能演进为:
👉 “中心化平台 + 去中心化数据产品” 的混合模式。