不得不说很多设备故障问题,都是因外部操作的牵一发而动全身引起了系统内部的蝴蝶效应。今天,经验丰富、行走的“知识库”—安图特工程师,为您带来V7000硬盘更换及“鬼盘”处理案例。
一、故障描述
客户一台IBM V7000存储更换故障盘后,在内部磁盘里出现脱机状态且无磁盘柜子和槽位信息的问题。
二、故障处理
1、现场情况还原
客户在更换硬盘后(更换方式不确定,据客户描述是按FIX修复模式执行),新盘在对应槽位已经为联机状态,已加入到Mdisk,数据已COPY BACK,而原Drive ID 37的旧盘信息依然残留在系统里,且在单元柜(Enclosure)和槽位 (Slot) 列表里无任何信息。工程师查看现场情况后,认为残留在内部磁盘的是Legacy drive(鬼盘)信息。
2、清除“鬼盘”信息方法
SSH登录V7000 CLI 命令行管理系统,执行命令查看硬盘信息:
>svcinfo lsdrive
前面红色为Drive ID,后面蓝色依次为单元柜(Enclosure)和槽位(Slot):
>svcinfo lsdrive 37 (当前用户硬盘为37),如下图:
删除Legacy drive信息(对应删除37号Legacy drive信息):
>svctask chdrive -use failed 37
>svctask chdrive -use unused 37
3、查看GUI内部磁盘信息,脱机状态的残留Legacy drive硬盘已清除。
三、经验总结
1、不仅是V7000存储,IBM Storwize V系列存储正常更换故障部件需执行DMP,GUI界面里为Fix Procedure流程,按向导方式更换相应部件,即在管理界面里 Monitoring > Events,选择相应的硬件设备的告警日志Run Fix Procedure。要求执行以下任务:
1)分析事件日志;
2)更换故障部件;
3)验证修复设备的状态;
4)恢复装置在系统的运行状态;
5)将错误标记为事件日志中固定的错误。
2、IBM V系列存储与别的存储不一样,更换硬盘时不能直接拔插,否则可能导致Legacy drive(鬼盘)信息的产生。对于此问题,预先请记录好故障硬盘的Drive ID和单元柜(Enclosure)及硬盘槽位(Slot)信息。完成FIX更换流程后,查看对应硬盘槽位的新硬盘的信息,且硬盘为联机状态(Online),Events告警信息已修复,方可SSH登录V7000 CLI命令行,执行对应清除Legacy drive(鬼盘)命令。
如欲了解更多,请登录安图特官方网站:www.antute.com.cn