买固态硬盘,我们会比较关注颗粒寿命,机械硬盘虽然几乎不用考虑长寿与否,除了考虑SMR/PMR记录方式外,最怕的其实就是坏,盘一挂数据未必能找回来,所以其故障率指标就显得尤为重要,
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
硬盘各种寿命指标
那这个指标一般就是MTBF了,全称平均无故障间隔(Mean TimeBetween Failure),也就是2次故障发生之间的时间段,取得是平均值。(MTBF=∑(T2+T3+T1)/ N,即总测试时间÷总失效量)
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
比方说MTBF达到100W小时,算下来时间足有114年,这并不是说114年无故障。由于MTBF=1/λ,λ=总失效数量÷总测试时间=1/MTBF=1/114年,最终得出其年故障率约0.87%,一万块硬盘里有87块出故障。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
这就是AFR年平均故障率,一般厂商也不会标,可以自己推算出来的。AFR=1 / (MTBF / 365 / 24),比方高端盘的MTBF是200w小时,则AFR≈0.44%。
另外还有MTTF指标,他才是平均无故障时间(Mean TimeTo Failure),一般是从你硬盘开始正常用,到发生故障的时间(MTTF=∑T1/ N)。对于用户来说心里更有个准儿。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
MTTR则是平均修复时间(Mean TimeTo Repair),等出现故障送修,到维修结束之间的平均值(MTTR=∑(T2+T3)/ N),这个值衡量硬盘的“可修复性”,不只是说坏了跑售后,
其实硬盘本身对错误有自动修复机制,不是所有问题都不可修复。它也是个平均数,各个方面都会影响这个值。(另外,维修换新时间应当计算上重写信息到新盘的时间)
另外有错误也未必能发现,有一个MTTD,也就是平均故障检测时间(Mean Timeto Detect),不过一般不会提到,因为故障实际上已经出现了,算在故障周期之中。总的来讲MTBF= MTTF+ MTTR,也就是平均发生一次故障事件循环周期。
在硬盘哪儿能看到
比方说最常见的西数蓝盘、希捷酷鱼,这种都是不标的,甚至官网技术文档里都没有。按照以前默认的100W小时,那也是以5x8h计算的,
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
而主流nas、监控盘也都是100W小时,但是以7x24h环境计算的。虽然看着没什么不同,但可以理解为在高压高负载环境下,普通盘的寿命可能稍差一些。 不过哪怕是NAS专用盘,每年出现挂盘的事件也不少,所以组NAS等需要存储大量数据的,都会组RAID多盘备份,挂一个还能接着用。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
企业盘200W小时起步,高端点儿的250W小时。虽说坏盘是低概率事件,运气好的可能一辈子都遇不上一次,但厂商不标总归信息是不透明的,能上高端盘肯定还是上高端盘放心。
总结
但高端盘现在都是大容量,现在动辄8T起步,加上这几个月来大幅涨价,哪怕临逢618也入手无望了。只有低容量普通盘还是原来的配方、还是原来的价格。不过目前看来,矿盘热度过去,价格有所回落。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
另外硬盘市场市场也不能贪便宜,翻新盘蛮多的,水货得自己转保,部分品牌由于外包售后,还出现过拒保或乱保的情况。所以真要遇到什么问题,往往很难解决,哪怕给换新数据也未必保得住,最好还是多买几块盘平常做好备份。当然备份也可以用各类网盘同步解决。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
另外MTBF等都只是理论值,事实上还得摸奖,什么盘好什么盘差,用数以万计硬盘的数据中心最有发言权,每年他们都会给出其“季度硬盘故障报告”,比方说BackBlaze,今年Q1的AFR表已经出了。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
个别投用不久的新盘基本都是0故障率,其中希捷 ST6000DX000 6TB平均使用71.8个月,故障率也几乎为0,不过只有886片样本数量较少。样品数量极大的里,表现最好的是HGST HMS5C4040BLE640 4TB,一万多块的AFR仅0.32%,大容量盘中表现最好的则是HGST HUH721212ALN604 12TB。
科普:什么是硬盘MTBF?那MTTF、MTTD、MTTR又是什么
另外目前各容量下质量最好的排行也更新了,这些可以说是相对更放心入手的了。
文章转自微信公众号:极客湾
延伸阅读:
硬盘检测及维修方法:不用拆开硬盘,软件强行修复方法
机械硬盘该怎么选?教你最全机械硬盘选购指南 |