这是我参与「第五届青训营 」伴学笔记创作活动的第 12 天
本堂课主要内容是系统设计之秒杀系统,下面是我个人听课时的一些笔记。
个人笔记
系统设计方法论
-
系统设计的问题:
- 为什么要做系统设计
- 系统设计的定义是什么
- 怎么做系统设计,如何落地一个系统
- 系统功能实现之后,如何分析瓶颈并优化
- 如何验证系统的可用性和稳定性
-
如何评估一个系统:
从系统的下列指标出发进行评估:
- 可用性
- 拓展性
- 安全性
- 易用性
- 性能
- 耦合性
- 可维护性
- 伸缩性
-
系统是什么?
系统泛指由一群有关联的个体组成,根据某种规则运作,能完成个别元件不能单独完成的工作的群体。
系统设计:
为了达成某种目的,通过个体组成整体的过程
-
系统设计的流程:
场景→存储→服务→拓展
-
场景分析(Scenario)
什么系统,需要哪些功能,多大的并发量
-
存储设计(Storage)
数据如何组织,Sql存储,NoSql存储
-
服务设计(Service)
业务功能实现和逻辑整合
-
可扩展性(Scale)
解决设计缺陷,提高鲁棒性、扩展性
也称为4-S分析法
-
-
如何发现系统的瓶颈:
- 火焰图分析
- 链路追踪
- 性能测试
-
如何保证系统的可用性和稳定性:
链路梳理:
- 核心链路
- 流量漏斗:流量会经过一个漏斗一样的“滤网”才能到达预设的“转化行为区域”
- 强弱依赖:可以对弱依赖进行降级
可观测性:
- 链路追踪:对一次请求做到全链路的追踪
- 核心监控:监控核心指标
- 业务报警:指标异常时进行报警
全链路测试:
- 压力测试:压力压到临界点甚至超过临界点,来观察服务是否还能满足可用性
- 负载测试:测试出链路的负载
- 容量测试:测出容量的水位
稳定性控制:
- 系统限流
- 业务兜底:下游业务返回错误时可以保证有兜底数据返回
- 熔断降级
容灾演练:
- 混沌工程:(故障注入)演练
- 应急手册:出现故障时的操作手册
- 容灾预案:出现故障时的预案
电商秒杀业务介绍
-
电商的三个要素:
人:消费者
货:供给侧
场:交易环境(线上电商、线下商场)
传统电商→社交电商→内容电商
-
秒杀业务的特点:
- 瞬时流量高
- 读多写少
- 实时性要求高
-
秒杀的挑战:
- 资源成本
- 反欺诈
- 高性能
- 防止超卖
- 流量管控
- 扩展性
- 鲁棒性
-
场景(Scenario)
功能:
- 秒杀活动发布
- 秒杀商品详情
- 秒杀下单
并发:
- 万人参与秒杀
- QPS 1W+
- TPS 1k+
-
存储(Storage)
三级存储:MySQL→Redis→LocalCache
-
服务(Service)
子服务:用户服务、风控服务、活动服务、订单服务
基础组件:ID生成器、缓存组件、MQ组件、限流组件
-
可扩展性(Scale)
流量隔离+CDN+缓存优化+流量管控
参考
- 字节直播实践课 —【手把手教你做系统设计之秒杀系统】