生产环境:
IBM小机p780,型号9179-MHC,双机oracle rac,系统版本6100-07-04-1216;
工作环境是双节点共享HP存储HSV360的磁盘资源。
问题背景:
新给存储添加磁盘,并mapping给小机的两个节点各两块磁盘hdisk120和hdisk121(每块盘均连接4个光纤卡,每个光纤卡有两条该盘的链路,也就是说每块盘均有8条链路),
两个节点主机系统扫盘后均能识别hdisk120和hdisk121。然后将hdisk120和hdisk121在第二节点分配PVID并在激活vg中使用,而第一节点的hdisk120和hdisk121均没有赋予PVID,
也没有投入使用。
问题现象:
第一节点的hdisk120(系统中并没有使用)链路出现问题,且每隔一个小时就报链路failed的errpt,通过lspath | grep hdisk120发现确实有链路failed,
分别是hdisk120对应的fscsi2的两条链路和fscsi6的两条链路失败(共计4条链路失败)。通过lsdev -l fscsi2/fscsi6 -F parent命令看到的这两块卡父设备分别是fcs2和fcs6。
lsdev -Cc adapter看到fcs2和fcs6这两块卡的状态均是available。lsdev -p fcs2/fcs6看到的fscsi2和fscsi6也均是available的。
但是,相同存储上的磁盘在第二节点上,hdisk120对应的8条链路均正常,没有出现任何问题。
尝试过解决方法:
方法1、删除hdisk120对应fscsi2和fscsi6设备,重新cfgmgr扫fcs2和fcs6,重新扫盘后链路恢复正常。实际上,过一个小时后之前failed的链路激活后重新变为failed。
方法2、通过执行chpath -l hdisk120 -p fscsi2/fscsi6 -s enable命令激活链路后,过一个小时,链路也重新变为failed。
各位同仁是否有遇到相同问题,如有解决方法敬请告知,谢谢!