最近Backblaze的硬盘故障率报告又出炉了,很多小伙伴扫一眼之后,大概会很惊讶于它提到的接近1%的故障率。难道硬盘这么不靠谱,用100个小时就会挂了?这问题的答案,小伙伴们看看自己的硬盘应该就知道,它的可靠性当然不至于这么差啦!但这个数据又是咋回事呢?小编今天就来说说这事儿吧。
实际上Backblaze是一家很正常的存储提供商,有点不同的是它比较喜欢使用消费级硬盘;至于数据也不是来自真正的测试,而是这家公司统计的故障硬盘数量。此外AFR这个数据是“年故障率”,也就是估算的一年会有多大比例的故障,比如这个季度统计的AFR数据是1%,说明这个季度里真正出故障的硬盘比例是0.25%。
按照这种计算方式,近期硬盘年化故障率是1%左右,那么换算到单一硬盘的故障间隔就是87万多小时(24小时×365天/1%)。这个水平其实并不低,远超硬盘厂商的质保时长了。比如希捷酷鱼的质保标准是每年2400小时,质保2年,酷鱼Pro则是每年8760小时,质保5年,所以从这一点上看,大家还是可以放心地购买硬盘的。
有些小伙伴大概对另一种硬盘故障率指标MTBF比较熟悉,其实ARF和MTBF基本上就是同一比例的两种说法。在硬盘官网上我们可以找到相关说明,例如https://www.seagate.com/cn/zh/support/kb/hard-disk-drive-reliability-and-mtbf-afr-174791en/。按照规则,AFR只是将统计的单位从”小时“变成了”年“(8760小时),注意这个规则中的小时数其实就是全年不休的工作时长。
当然,在普遍使用MTBF数据时,我们常常会看到百万小时级别的保证,确实让人放心,但按照前文所述,这些硬盘的无故障时间只有几十万小时,这正常吗?我们同样可以从官方说明里看到答案,即“现场MTBF通常为预计MTBF的50-60%”,这样看来,Backblaze的数据与消费级硬盘100万小时~200万小时的MTBF还真的很吻合。
小编这里必须说一下,Backblaze的数据虽然勉强够得上正常,但已经是下限了,按照厂商说明,MTBF在120万小时左右时的硬盘,AFR应该在0.73左右。而Backblaze的数据不太好显然与大规模存储的工作环境恶劣,显然不符合AFR正常测试要求有关。至于小伙伴们,要想让硬盘为自己安全稳定地工作,当然应该给它更舒适的环境,比如AFR测试环境提到的箱体温度不要超过40℃,不要频繁地开关机等等。