经常看到各种技术文章或者分布式系统介绍说系统的可用性达到了多少个9,那么所谓”几个9“到底是怎么计算的?又意味着什么?我们简单计算分析下看看。所谓”1个9“是指90%,”2个9“是指99%,”3个9“是指99.9%,依次类推。

可用性的反面是故障时间,网站或者分布式系统会因为很多原因导致不可用,比如:程序bug;运维更新错误;环境配置升级变化;机器硬件故障;被恶意***;网关不小心踢掉了网线/电源插座;市政施工挖断了光纤;程序猿删库跑路;地震海啸自然灾害等等。

如果按照年为单位计算系统的故障时间,公式如下:

故障时间秒数=(1-可用性) * 365 * 24 * 3600


对应可用性宕机时间如下:

可用性故障时间(秒)故障时间(小时)故障时间(天)
99%31536087.63.65
99.90%315368.760.365
99.99%3153.60.8760.0365