去年买的n手存储炸了,竟然数据没丢
去年600块钱买的2288v2,今年升级了64g内存,然后跑了三四个月,内存故障,直接下线。
上面直连挂了6个16t hdd,pve系统,运行jira,freenas 等虚拟机,最早两个硬盘直接ext分区,后来两个放到freenas组raid0做临时盘,最后两块我发现直接可以在pve里面做zfs,做了个raid1,备份日常项目数据。
freenas出的nfs,计算节点用,出事的那天,计算节点因为nfs宕机,卡住了,pve宿主也连不上。晚上过来机房一顿捣鼓也没恢复。
机器抱回家,报内存错误,一顿换内存接口,最后识别出来48g内存。同时采购二手服务器,机械硬盘,看能救回来多少数据。
当时也纠结,要不要上netapp,渠道也都联系好了。最后没舍得花十万块,寻思一万块解决一下
第二天又去的机房,设备和配件也到了,先装机。
1288v3和2288v3各一台,1288带u2。满盘架,两台3300左右。带一个ssd
ssd有点坑比,98磨损(剩余2%命),2288直接亮灯了(虽然能开机),看着挺新的
装完之后,旧机器勉强开机,先把虚拟机尝试写到本地磁盘cow2。中间失败两次,内存又失败。好在最后一根16g撑了下来,把虚拟机数据都移出来了。
然后就是倒腾hdd里面东西,由于不知道状态,因此没有轻易换机器。倒腾差不多了,有吧raid1的拔下来,插到新的机器上
插到新机器上,pve gui不认,百度一下,发现直接import zpool名字就行,如果报错就加个-f。于是乎raid1就这么稀里糊涂恢复了。
照葫芦画瓢,raid0的竟然也恢复了。
然后虚拟机重新部署上,所有东西都没啥问题。如果虚拟机受损,最近三个月团队工作的记录就没了。
接下来又在pve上面装的rsnapshot,raid1做好项目/jira/svn日备份
后来把坏机器的ssd,怼到1288上面,省的装系统了。
这次事件告诉我们一定要做好备份,虽然数据没丢,但是耽误了几天时间,团队的时间就是金钱。
后面有机会还是要上专业存储。
pve自带的zfs看起来也不错,freenas用起来不是那么容易,ldap什么的也整合的一般,权限什么的总是有问题我没办法解决。后面就准备沿用这套架构了。
后来买了u2的盘
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~