IBM小机rac双机共享存储的磁盘,系统中报链路失败问题

生产环境:

IBM小机p780,型号9179-MHC,双机oracle rac,系统版本6100-07-04-1216;

工作环境是双节点共享HP存储HSV360的磁盘资源。

问题背景:

新给存储添加磁盘,并mapping给小机的两个节点各两块磁盘hdisk120和hdisk121(每块盘均连接4个光纤卡,每个光纤卡有两条该盘的链路,也就是说每块盘均有8条链路),

两个节点主机系统扫盘后均能识别hdisk120和hdisk121。然后将hdisk120和hdisk121在第二节点分配PVID并在激活vg中使用,而第一节点的hdisk120和hdisk121均没有赋予PVID,

也没有投入使用。

问题现象:

第一节点的hdisk120(系统中并没有使用)链路出现问题,且每隔一个小时就报链路failed的errpt,通过lspath | grep hdisk120发现确实有链路failed,

分别是hdisk120对应的fscsi2的两条链路和fscsi6的两条链路失败(共计4条链路失败)。通过lsdev -l fscsi2/fscsi6 -F parent命令看到的这两块卡父设备分别是fcs2和fcs6。

lsdev -Cc adapter看到fcs2和fcs6这两块卡的状态均是available。lsdev -p fcs2/fcs6看到的fscsi2和fscsi6也均是available的。

但是,相同存储上的磁盘在第二节点上,hdisk120对应的8条链路均正常,没有出现任何问题。

尝试过解决方法:

方法1、删除hdisk120对应fscsi2和fscsi6设备,重新cfgmgr扫fcs2和fcs6,重新扫盘后链路恢复正常。实际上,过一个小时后之前failed的链路激活后重新变为failed。

方法2、通过执行chpath -l hdisk120 -p fscsi2/fscsi6 -s enable命令激活链路后,过一个小时,链路也重新变为failed。

各位同仁是否有遇到相同问题,如有解决方法敬请告知,谢谢!

参与6

1同行回答

yszw0817yszw0817存储架构师北京
具体还是要看系统报错,初步建议,在存储端把hdisk120对节点1的做unmapping试试。兄弟,顺便errpt -aj xxxxx发上来看看呢。显示全部

具体还是要看系统报错,初步建议,在存储端把hdisk120对节点1的做unmapping试试。

兄弟,顺便errpt -aj xxxxx发上来看看呢。

收起
硬件生产 · 2015-12-11
浏览2726
  • 谢谢您的解惑,不过,经自己调查该问题已解决!解决方法是修改磁盘的属性reserve_policy的值为no_reserve
    2015-12-11

提问者

caichalou
系统工程师中国邮政储蓄银行
擅长领域: 服务器存储云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-12-09
  • 关注会员:4 人
  • 问题浏览:4333
  • 最近回答:2015-12-11
  • X社区推广