客户Oracle数据库不能正常为表空间创建数据文件,有可能影响正常业务。工程师及时响应,很快就解决了本次故障,现将处理过程分享给大家。
备份软件COMMVUALT 上的任务全部失败和停止,之后接到客户服务请求:虚拟带库VTL 物理故障,其中一个机头宕机。因宕机机头上的业务多为重要数据库备份,不能备份会导致业务系统空间被撑爆,客户希望工程师立即解决此次故障。
HIS与EMR两套核心生产数据库,且均为两节点OracleRAC架构,运行在IBM Power小型机上,每节点为3CoreCPU与56G内存,AIX系统版本为AIX 7.1,数据库版本为11.2.0.3.0。目前HIS数据库系统实际数据量约为160G(数据文件占用空间为272G),EMR数据库系统实际数据量约为90G(数据文件占用空间为122G)。
用户报修存储告警且业务应用受到影响,检查发现华为S2600(版本号V100R005C02)一个RAID组中两块盘于半小时内先后发生故障,RAID5离线。
一台IBMDS5100工作期间出现故障,设备A控亮黄灯,IP和光纤不通;B控IP和光纤通,但控制器的代码不正常,不能正常访问。对B控采取后端处理后,可以管理DS5100存储。工程师为确认故障根源,收集了存储的support日志进行分析。
某电信运营商接到大量用户投诉:使用手机本地3G/4G网络时,出现“网页打不开”、“观看视频卡顿”“玩手机网络游戏卡顿”等现象。
一台连接IBMDS5020存储的业务数据库无法访问。工程师抵达现场后登录存储管理软件,诊断发现2块硬盘故障,分别为85柜slot10和85柜slot7,且2块盘属于同一RAID组成员盘(RAID级别为5)……
NS480 NAS存储上某CIFS文件系统NAS_3无法访问。工程师抵达现场后,着手定位故障。通过WEB端登录后检查NAS_3的配置信息,确认配置无误。删除export后,重建export失败,报错
浪潮NF5270M3服务器宕机,全部虚拟机不可用。工程师到达现场后发现,服务器前面12块硬盘全亮红灯。重启服务器,进入RAID卡WEBBIOS查看得知,由12块硬盘组成的RAID5未配置热备盘,其中硬盘故障。
客户监控显示设备故障,SVC故障节点停止对外服务,故障原因待确认。