P5-570宕机

用户的机器最开始报电源错误,而且通过机器后方电源状态灯发现有2个电源模块已经故障,而且运行一周左右时间就宕机
---------------------------------------------------------------------------
LABEL:          SCAN_ERROR_CHRP
IDENTIFIER:     BFE4C025

Date/Time:       Tue Jan 13 10:08:31 2015
Sequence Number: 63235
Machine Id:      00C5102C4C00
Node Id:         LIHDMCMDS01
Class:           H
Type:            PERM
Resource Name:   sysplanar0
Resource Class:  planar
Resource Type:   sysplanar_rspc
Location:        

Description
UNDETERMINED ERROR

Failure Causes
UNDETERMINED

        Recommended Actions
        RUN SYSTEM DIAGNOSTICS.

Detail Data
PROBLEM DATA
0644 00E0 0000 0600 9600 8E00 0000 0000 0000 0000 4942 4D00 5048 0030 0100 3F30
2014 1223 0157 3207 2014 1223 0157 3208 4500 0106 0000 0000 0000 0000 0000 0000
509A E5B4 509A E5B4 5548 0018 0100 3F30 6103 4400 0000 0000 0000 A804 0000 0000
5053 00F4 0101 3F30 0201 0002 0000 00EC 003C 0002 0000 0000 0000 0000 0000 0000
..........

Diagnostic Analysis
Diagnostic Log sequence number: 19690
Resource tested:        sysplanar0
Resource Description:   System Planar
Location:               
SRC:                    11001524
Description:            Power/Cooling subsystem Unrecovered Error, bypassed
                        with loss of redundancy. Refer to the system service
                        documentation for more information.
Additional Words:       2-003C0002 3-00000000 4-00000000 5-00000000
                        6-00000000 7-00000000 8-00000000 9-00000000
Possible FRUs:
    Priority: L FRU: 39J2779  S/N: YL1116P66140 CCIN: 51B7
    Location: U7879.001.DQDKLFV-E2
    Priority: L FRU: 03N6355  S/N: YL11C6063033 CCIN: 28EA
    Location: U7879.001.DQDKLFN-P1-C8
在换完电源模块后经过一周时间发现机器又宕了,重新开机查看报错,发现CEC报了好多错误

IMG_20150121_085305.jpg

IMG_20150121_091133.jpg


在IBM硬件信息中心查到了这些

p570报错信息.jpg

p570报错信息1.jpg


难道这些都坏了?请问接下来该怎样排查啊?到底用不用把报错的全换掉?
参与14

13同行回答

qy115867317qy115867317系统工程师盘锦辽河数码科技发展有限公司
回复 11# 北京宝汇德 电源已经换过了,截图是换了电源之后的新报错。显示全部
回复 11# 北京宝汇德

电源已经换过了,截图是换了电源之后的新报错。收起
系统集成 · 2015-01-28
浏览1995
北京宝汇德北京宝汇德副总经理/副总裁北京宝汇德技术服务有限公司
截图中的报错是IO板和cpu板显示全部
截图中的报错是IO板和cpu板收起
系统集成 · 2015-01-28
浏览1823
北京宝汇德北京宝汇德副总经理/副总裁北京宝汇德技术服务有限公司
Priority: L FRU: 39J2779  S/N: YL1116P66140 CCIN: 51B7      Location: U7879.001.DQDKLFV-E2    该位置的电源有问题,换个电源就OK了。显示全部
Priority: L FRU: 39J2779  S/N: YL1116P66140 CCIN: 51B7
     Location: U7879.001.DQDKLFV-E2   

该位置的电源有问题,换个电源就OK了。收起
系统集成 · 2015-01-28
浏览1852
qy115867317qy115867317系统工程师盘锦辽河数码科技发展有限公司
回复 9# 北京正群欣世 1.已经断电重新插拔了,还是报这些错误;2.现尝试第二种方式,把CEC上装有CPU和VRM的模块和主机头上的对调了,目前正在观察。显示全部
回复 9# 北京正群欣世
1.已经断电重新插拔了,还是报这些错误;
2.现尝试第二种方式,把CEC上装有CPU和VRM的模块和主机头上的对调了,目前正在观察。收起
系统集成 · 2015-01-28
浏览2501
北京正群欣世北京正群欣世项目总监北京正群欣世信息技术有限公司
看报错是Un-P2-C1 和Un-P2-C2,是Processor card 1和Processor card 2,建议断电,重新插拔试试。显示全部
看报错是Un-P2-C1 和Un-P2-C2,是Processor card 1和Processor card 2,建议断电,重新插拔试试。收起
系统集成 · 2015-01-28
浏览2415
北京荣歆咨询北京荣歆咨询系统架构师北京荣歆咨询有限公司
回复 5# qy115867317 图片看不清,比如type 是P还是T,等等。errpt里不止BFE4C025这一条吧显示全部
回复 5# qy115867317

图片看不清,比如type 是P还是T,等等。
errpt里不止BFE4C025这一条吧收起
IT咨询服务 · 2015-01-27
浏览2482
zwz99999zwz99999系统工程师dcits
更换后升级一下微码显示全部
更换后升级一下微码收起
系统集成 · 2015-01-27
浏览2400
qy115867317qy115867317系统工程师盘锦辽河数码科技发展有限公司
回复 3# yhsih 570的问题确实挺多啊显示全部
回复 3# yhsih

570的问题确实挺多啊收起
系统集成 · 2015-01-27
浏览2443
qy115867317qy115867317系统工程师盘锦辽河数码科技发展有限公司
回复 4# 北京荣歆咨询 图片信息和 errpt -aj BFE4C025显示的信息一致显示全部
回复 4# 北京荣歆咨询
图片信息和 errpt -aj BFE4C025显示的信息一致收起
系统集成 · 2015-01-27
浏览2490
北京荣歆咨询北京荣歆咨询系统架构师北京荣歆咨询有限公司
硬件排查要看详细信息的,errpt |pg然后选出重点的号errpt -aj xxxxx显示全部
硬件排查要看详细信息的,
errpt |pg
然后选出重点的号
errpt -aj xxxxx收起
IT咨询服务 · 2015-01-27
浏览2496

提问者

qy115867317
系统工程师盘锦辽河数码科技发展有限公司
擅长领域: 服务器主机云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-01-27
  • 关注会员:1 人
  • 问题浏览:9249
  • 最近回答:2015-01-28
  • X社区推广