来源: 2021-阿里技术人的百宝黑皮书-淘系技术-勇剑
正文
在面试中是不是经常被问到一个问题:如果你系统的流量增加 N 倍你要怎么重新设计你的系统?这个高并发的
问题可以从各个层面去解,比如
代码层面:
-
锁优化(采用无锁数据结构),主要是 concurrent 包下面的关于 AQS 锁的一些内容
-
数据库缓存设计(降低数据库并发争抢压力),这里又会有缓存、DB 数据不一致的问题,在实际使用中,高并发系统和数据一致性系统采用的策略会截然相反。
-
数据更新时采用合并更新,可以在应用层去做更新合并,同一个 Container 在同一时间只会有一个 DB更新请求。
-
其他的比如基于 BloomFilter 的空间换时间、通过异步化降低处理时间、通过多线程并发执行等等。
数据库层面:
-
根据不同的存储诉求来进行不同的存储选型,从早期的 RDBMS,再到 NoSql(KV存储、文档数据库、全文索引引擎等等),再到最新的NewSql(TiDB、Google spanner/F1 DB)等等。
-
表数据结构的设计,字段类型选择与区别。
-
索引设计,需要关注聚簇索引原理与覆盖索引消除排序等,至于最左匹配原则都是烂大街的常识了,高级一点索引消除排序的一些机制等等,B+树与B树的区别。
-
最后的常规手段:分库分表、读写分离、数据分片、热点数据拆分等等,高并发往往会做数据分桶,这里面往深了去说又有很多,比如分桶如何初始化、路由规则、最后阶段怎么把数据合并等等,比较经典的方式就是把桶分成一个主桶+N个分桶。
架构设计层面:
- 分布式系统为服务化
- 无状态化支持水平弹性扩缩容
- 业务逻辑层面 failfast 快速失败
- 调用链路热点数据前置
- 多级缓存设计
- 提前容量规划等等