客户IBMx3650M5服务器宕机。重启机器发现无法正常启动,登录IMM查看eventlog,发现DIMM16报错,初步判断内存损坏。
客户报修HP EVA4400存储硬盘故障,外观显示slot2的位置硬盘故障。工程师准备更换故障硬盘,登录EVA管理控制台时提示controller2(图1)需要注意磁盘组(图2)被标记感叹号,查看日志报错信息,显示controller2 DP1B端口link丢失,默认磁盘组被标记感叹号。
客户多台主机系统同时报错存储磁盘故障,初步推断是存储出现故障。
应客户需求扩容Linux文件系统。实施过程中,将硬盘映射给主机,创建PV并添加到VG后,系统提示“unknown device”
工程师接到客户报修电话,一台Linux系统磁盘使用率异常。df -h 发现磁盘使用率为100%,重启后再次尝试df -h,磁盘使用率仍为100%。通过lsof查看没有应用程序占用已删除的数据;du -sh /查看/目录下占用的空间与实际磁盘使用率不一致,相差很大,磁盘无可用空间存储数据。
客户一台Linux系统频繁重启,工程师接到报修电话后登录查看,发现日志中大量的oom,内存溢出告警,每次重启后,不启动任何应用程序,主机内存很快被占满;同时其余客户端使用sftp传输数据,经常因内存溢出导致传输失败,影响业务。
某客户TSM备份值班人员报告TSM server 某个驱动器工作异常,备份仅一个通道可以使用,部分schedule因没有通道导致备份失败。
客户反馈一套业务数据库经常出现卡慢,甚至输入字符也会出现延迟效果,重新启动后,数据库查询速度得到提升,但随着使用频次增加,速度再次变慢。检查所有JSP网页发现,记录集、statement和数据库连接都已被释放。
安图特接到客户服务请求,到达现场发现ceph状态报警,提示其中某一个pg状态报错,造成服务响应缓慢,涉及osd.1。
客户一台IBM P750主机,PowerVM 环境,其中一个VIOC在日常监控中发现CPU使用率有上升趋势。