数据分片策略：如何让数据库支撑亿级并发？在高并发系统中，单个数据库往往无法承受巨大的数据量和查询压力，因此数据分片（S

在高并发系统中，单个数据库往往无法承受巨大的数据量和查询压力，因此 数据分片（Sharding） 是常见的优化方案。它能够将数据拆分到多个数据库实例上，从而提升读写性能，并降低单点故障风险。本文将深入探讨数据分片的常见策略、优缺点以及在实践中的优化方法。

数据分片是一种将 大表拆分成多个子表，并分布在不同数据库或数据库实例 的技术，目的是缓解单一数据库的负载，提高并发能力。

数据分片主要有 水平分片（Horizontal Sharding） 和 垂直分片（Vertical Sharding） 两种方式：

水平分片（按数据行拆分）
- 将 同一张表的数据 拆分到不同数据库实例中，每个分片存储部分数据。
- 例如：用户表 users 按 user_id % 3 拆分成 users_0、users_1 和 users_2。
- 适用场景：数据量大，单表查询压力大，如 订单表、用户表。
垂直分片（按表字段拆分）
- 将 同一数据库中的不同表拆分 到不同数据库实例，每个实例存储部分业务数据。
- 例如：用户的基础信息（users_basic）和用户的行为日志（users_logs）存储在不同数据库。
- 适用场景：字段数量过多，查询时不需要所有字段，如 用户基础信息和扩展信息分离。

基于 Hash 分片
- 通过 hash(key) % 分片数 计算数据存放位置，保证数据均匀分布。
- 优点：数据分布均匀，避免热点问题。
- 缺点：扩展时难以迁移数据，容易造成数据倾斜。
基于范围分片（Range Sharding）
- 例如 user_id 在 1~~100万存入 db1，100万~~200万存入 db2。
- 优点：查询某个范围的数据时性能较好。
- 缺点：数据增长不均匀时，可能导致某个分片压力过大（如最新订单集中在最后一个分片）。
基于时间分片
- 例如按照时间 order_202301、order_202302 按月拆分订单表。
- 优点：查询近期数据时性能较好，支持自动归档。
- 缺点：查询跨多个分片数据时，可能导致复杂查询。
动态分片（Middleware 方案）
- 通过 分片中间件（如 MyCat、ShardingSphere）进行分片管理，屏蔽数据库路由逻辑。
- 优点：透明化，支持扩展。
- 缺点：可能增加额外的查询开销。

数据分片是大规模数据库优化的重要手段，合理选择分片策略可以极大提升数据库的吞吐能力，同时需要考虑分片查询优化，以保证查询性能不会受到影响。