高并发系统学习 Day8 高可用高可用性（High Availability，HA）是你在系统设计时经常会听到的一个名

高可用性（High Availability，HA）是你在系统设计时经常会听到的一个名词，它指的是系统具备较高的无故障运行的能力。

可用性的度量：
1）MTBF（Mean Time Between Failure）是平均故障间隔的意思，代表两次故障的间隔时间，也就是系统正常运转的平均时间。这个时间越长，系统稳定性越高。
2）MTTR（Mean Time To Repair）表示故障的平均恢复时间，也可以理解为平均故障时间。这个值越小，故障对于用户的影响越小。

高可用系统设计的思路：
1. 系统设计：“Design for failure”是我们做高可用系统设计时秉持的第一原则。在承担百万 QPS 的高并发系统中，集群中机器的数量成百上千台，单机的故障是常态，几乎每一天都有发生故障的可能。
降级是为了保证核心服务的稳定而牺牲非核心服务的做法。
限流完全是另外一种思路，它通过对并发的请求进行限速来保护系统。
2. 系统运维：
在系统设计阶段为了保证系统的可用性可以采取上面的几种方法，那在系统运维的层面又能做哪些事情呢？其实，我们可以从灰度发布、故障演练两个方面来考虑如何提升系统的可用性。

此文章为5月Day8学习笔记，内容来源于极客时间《高并发系统设计 40 问》