细说12块10TB氦气盘用RAID5重建100TB空间能否成功
背景
随时近年来家用nas的不断普及,越来越多的家庭选择NAS作为数据存储与备份、影音数据库搭建以及协同办公等方案的核心设备。而对于一台多盘位的NAS来说,如何来选择一种适用于自己,同时又兼具安全可靠的磁盘存储方式也是一直困扰着大家的问题。笔者在组建NAS时也纠结于此很久,综合考虑自身使用情况后,最后选择只能承受一块硬盘损坏冗余的RAID5形式。由于笔者的技术水平有限,也非专业人员,不具备进行大量技术阐述和评测的水平,因此也不对RAID5的安全性作评价,只想通过一个实验来向K友展示100TB的RAID5到底能否重建成功,重建时间需要多久,以供大家参考。
教你搭建家用万兆百TB级的影音库(QNAP TS-1635AX)
https://www.hao4k.cn/thread-33945-1-1.html
必要性
笔者的处女作在发表后得到了广大K友的关注和支持,同时笔者也在和大家的交流中学到了诸如ZFS、ceph以及磁带机等数据储存方式的知识,在此深表感谢。笔者在浏览文章评论时,也注意到大家讨论和吐槽最多的地方,就是笔者选用的10TB*12的RAID5存储方式的安全性(见图1),其中关键词最多的就是“不具有可修复性”、“重建时间久”、“重建必然失败”,令人谈“5”色变,俨然就是一个数据火葬场。那么,RAID5到底有这么糟糕吗?
04184523a1mam2topua.jpg
图1
K友对RAID5的评论 笔者首先感谢各位K友对我数据存储的关心以及善意的提醒,类似这些关于RAID5的评价笔者在前期调研时也常常在其他地方看到。但是我相信90%的发表这些评论的K友和我一样,并没有重建过RAID5的实操经验,而99.99%的K友更没有重建过10TB*12这种百TB级的RAID5,这些信息也只是来源于口耳相传或者理论计算。笔者同样也没有RAID5重建的经验,因此无法判断这些说法的可靠性。出于好奇心,也为了给大家多一点实战经验作为参考,成为那0.01%的人,笔者决定舍命陪君子,进行一次破坏性实验以验证100TB级的RAID5到底是否具有可修复性、重建时间是否真的要十几天之久或者重建成功率是否只有相当于双色球三等奖的水平。实验条件
实验用的平台是16盘位QNAP的TS-1635AX,硬盘采用WD Elements 10TB拆机盘WD100EMAZ氦气盘12块。
041845230u5vmfpuq5l.jpg
QNAP TS-1635AX
04184523vx40jcyv222.jpg
主角 WD100EMAZ氦气盘12块实验对象为利用QNAP TS-1635AX组建的12块10TB RAID5,逻辑分区为单一静态卷,实际容量约为100TB,已用空间85.3TB,全部为视频数据。
04184523bo22xsc5orr.jpg
04184523nef2j0psb1h.jpg
04184523get1ksalkig.jpg
实施过程
为了模拟RAID故障,笔者通过在NAS关机时,随机拔掉其中一块硬盘来模拟RAID中一块硬盘下线的情景。重新开机后,NAS提示一块硬盘发生故障,RAID进入降级运行模式。注意:这种降级模式下,RAID上的数据仍可进行读写操作,但是由于冗余硬盘已损坏,RAID已处于非常脆弱的状况,此时应该立即停止读写作业,更换硬盘启动数据重建程序。如果有条件和技术能力的,可利用专业软件将全部硬盘进行数据镜像(即克隆)再进行重建作业,以防万一。
04184523koq0ae3l0m1.jpg
提示一块硬盘故障
04184523wvvhujkw5xp.jpg
RAID提示Disk8不存在 进入降级模式 笔者将经过1个半月转运,恰巧今天刚刚收到的全新WD Easystore 10TB拆盘,得到一块相同型号的WD100EMAZ氦气盘。
04184523xtluzjoxuma.jpg
WD Easystore 10TB拆盘 将该盘热插入NAS的8号插槽,系统识别后自动开启重建模式。重建起始时间为北京时间4月3日20:28。重建优先级设定为重新同步优先(高速)模式,初始时重建速度约为165MB/s,据此速度预计的重建时间约为16小时(可见并没有几天乃至十几天那么久)。
04184523fvywhikcwl0.jpg
插入硬盘后系统自动启动重建程序
04184523w4si1wtzt5x.jpg
重建速度与预计完成时间
04184523ufsewyzkajc.jpg
重建开始时间此时,除8号盘外,其余盘均进行全速读取作业,而8号盘则进行同速写入作业。
041845240ljzkdchbuy.jpg
8号盘写入,其余盘读取随着硬盘长时间的读写作业,读写速度会逐渐降低,温度也会有所升高,这也就是大家所提到的重建时的风险。
04184524geqxg2j2xrl.jpg
重建11小时完成64.5% 速度降至130MB/s
04184524mzltigw5zth.jpg
重建15小时完成82.8% 速度降至110MB/s
04184524ypidtq1swvj.jpg
重建17小时完成91.9% 速度降至100MB/s
041845244xik4db3ki1.jpg
重建17小时后各硬盘温度
04184524lq1epdjmf5p.jpg
19个半小时重建完成
04184524uzc34izkx4q.jpg
重建完成4月4日15:59 RAID重建完成,历时19小时31分,重建后RAID状态正常、数据正常。
结论
此次实验结果仅仅是一次重建成功的案例,也许只是因为笔者拥有能中双色球三等奖的好运气而已。所以笔者并不想仅通过此一文就说明RAID5有多么的安全和可靠,只是想向大家客观地展示RAID5也没有想像中的那么危险和脆弱。
最后,总结三点吧:
1. 不是万能的,对于存储方式每个人有着自己的使用情景、习惯和侧重点,因此要寻找一个适合自己的存储方式,平时养成良好的备份习惯最重要;
2. 及时关注RAID状态,当发生降级时及时作好重建或者全盘镜像(没有技术经验的切勿盲目自行操作,应寻求客服或者专业人员的帮助,让专业人作专业事)。因为在RAID降级状态下,仍然可以进行读写操作,所以有好多RAID损毁的案例都是因为没有及时发现冗余磁盘已经损坏,继续带病作业导致磁盘相继损坏;
3. 前辈们告诉我们“实践出真知”,因此在发表言论时要有依据,不要人云亦云。
上一篇文章:
教你搭建家用万兆百TB级的影音库(QNAP TS-1635AX)
https://www.hao4k.cn/thread-33945-1-1.html |