客户机房非正常断电,待恢复供电后,数据库无法正常启动。
某客户数据中心搬迁项目中,共涉及七次新旧数据中心网络割接任务,在执行第二次网络割接任务时,出现了华为S9712交换机与锐捷S7850交换机使用MSTP协议对接时产生环路的问题。
本项目中OpenStack云平台存储直接连接到物理机,不便于扩容、数据压缩等管理,为解决这一问题,需将OpenStack云平台存储统一纳入到SVC下进行管理,并对底层老旧存储进行更新。
客户报修一台IBMDS5300多条链路降级故障。
EMC DMX存储故障,在同一个Raid中两块硬盘发生故障,导致数据丢失,经抢救后数据成功恢复。由于存储设备中同一Raid短时间内损坏2块硬盘的现象非常少见,并且我们在没有备份的情况下成功恢复了数据。
数据中心是7*24不间断运转,并且承载着一系列企业赖以生存的信息资产,因此在数据迁移过程中,保障业务连续性和数据高可靠性就成为项目的核心需求和成败关键点。
数据库所使用的两台存储比较老旧,无论是性能还是容量均不能满足现有的业务需求,因此客户购进了两台新存储,准备将数据库迁移到新存储上,并对磁盘组进行扩容。
某数据中心有30多台HP-UX主机操作系统运行的生产环境,全部采用传统人工手动加磁带进行系统备份。这种传统备份方式费时费力且出错概率极大。因此,实施部署一套针对现有数据中心HP-UX系统备份的集中备份系统环境,从而实现操作系统备份自动化及系统恢复操作简易化。
TSM的节点node和namespace是一一对应的,在分布式环境下,多台参与计算的主机如果用传统的node备份方式,将会出现每个节点一个namespace的现象,备份、管理起来很繁琐。
一台设备型号为P510的IBM小型机,系统中有提示CPU及内存错误。工程师赴现场检查,主机正常运行,初步诊断为临时报错,建议继续观察。两天后,该小型机宕机,无法启动,问题再次出现并更加严重。
目前数据中心的容灾系统,多采用存储级数据复制技术。这种容灾方式,是存储端对端的实时备份,对于应对硬件故障可以发挥重要作用。但如果主生产端发生逻辑层面的错误或损坏,底层复制方式将导致主备中心均出现数据错误或损坏,使灾备中心失去作用。
由于机房电力施工,导致P570单电工作,这期间,此单路电源故障,导致主机宕机。进行检查之后,对故障电源进行了更换后机器可以正常启动到操作系统。
某烟草专卖局为提升网络质量,决定进行网络改造。由之前仅电信提供的单专线接入服务,改造为电信、移动、联通三家ISP同时提供的专线接入服务。改造后电信、移动专线承载一般性业务,联通专线承载视频会议业务。
安图特接到客户报修AIX主机应用访问缓慢,工程师随即到达现场进行处理,经排查后得到初步结果,存储、交换机、主机以及链路并无明显故障。后进行深入排查,发现主机端powerpath多路径软件进程CPU占用率非常高,导致CPU 100% busy,从而造成应用访问缓慢。
某银行客户提出的优化需求,希望进行一次数据库性能优化。该数据库每晚都要进行跑批操作,每次执行需花上整晚时间。客户希望可以对整个跑批操作进行分解,并分析出可以优化的部分,进行改进缩短跑批时间。
数据库业务出现异常。该数据库每天都要进行跑批操作,今天进行操作时数据库却hang住没有反应。
安图特接到客户报修,一台PC服务器在运行过程中因误操作将一块硬盘拔下,导致机器的一个raid5阵列数据出现损坏。接到报修后立即派工程师赶赴现场并尝试系统下进行恢复数据,但以失败告终。在数据恢复失败后工程师对故障问题进行了分析,并最终决定重建该阵列。
AIX系统在逻辑卷级提供了磁盘镜像功能,以增加数据的可用性和可靠性,镜像一旦出现异常,如当其中一块硬盘损坏时,就可能造成数据丢失从而引发严重后果,所以在日常维护中都会经常对镜像状态进行检查。
HDS Hnas3080存储的管理控制台唯一的内置硬盘出现报错。对于当前状况工程师对设备进行了分析并实施解决方案。
安图特接到客户报修,客户一台SunFireV890设备无法启动,双机没有正常切换,业务中断。