IZ92384: DISK ATTRIBUTES CHANGING TO DEFAULTS AFTER REBOOT APPLIES TO AIX 7100-00
A fix is available
Obtain the fix for this APAR.
APAR status
Closed as program error.
Error description
XIV hdisk attributes (like algorithm, reserve_policy...
不管是X86 RAID卡还是Power上的RAID卡,坏起来维护很麻烦。
通过如上的一些日志,基本锁定了元凶就是因为Powerha当时的串口心跳异常导致一台主机宕机发生。找到了原因,那就把主机启动起来吧,结果意外发生了,这台主机无法启动了,最终定格在了11002630了。似乎是硬件问题了,赶紧call来原厂商处理厂商说这是因为CPU Regulator导致的,调来了...
经过咨询novell和IBM工程师,结论是IBM这类服务器在装linux系统的时候,如果光驱有问题确实是会导致宕机。
说的是啊,因为当时属于在测试的设备上做。所以就大胆了一点。当然教训也相当深刻了。
这种机型是可以单U启机,但是你的现场估计没有所需的东西,保留CPU1,拆了CPU2,拔掉2的VRM,然后插上PROCESSOR FILLER CARD。你说的几种可能都是有可能的,先更换报错的那个CPU吧,你下面11001511很有可能是不规范的单U启机操作而造成的,我只是猜测。...
看看交换机上连该光纤的端口,是否有大量的CRC报错?无意的触碰会导致链路传输不稳定,影响IO传输效率。
猜测是不是两边的存储都连接在了同一块HBA卡的两个口上面,然后HA没有停就扫描的,那样扫描链路会断一下的样子。
究竟用户自己做的什么操作导致的此次事件呢用户业务系统有一个文件系统存储空间不够了,需要扩容,但是目前共享vg里的空间无法满了,需要重新加新的磁盘到vg里,存储管理员分配新的磁盘给两台主机,然后用户通过Powerha cspoc去加盘,扩容FS。就是这么一个操作导致的问题发生。原...
我个人感觉针对此案例:1、方案出来后,方案评审不能走过场。2、灾难切换演练必须进行,应充分测试。3、单点故障是系统管理员及相关负责人对整体方案必需考虑的因素,必须加以重视。4、此故障案例缺乏监控手段,未有效快速故障定位。...