活动简介
为了增强故障分析能力,Power服务器增加了对设备故障当前环境保存的功能,就是将保存一份设备故障时的内存、CPU寄存器、IO设备的数据和状态信息,如果系统并没有停住,只是某个程序挂起,会产生CORE DUMP,在当前目录下产生一个CORE文件。而如果操作系统挂起,则产生SYSTEM DUMP或者SYSTEM Crash,通常会引起机器停机。
当发生系统DUMP时,机器将会被宕下来。可能的原因包括:系统在进行内核操作时发生了未知的意外或者不能对其进行正常处理,都会引起DUMP。也可以由系统管理员发出命令,强制系统DUMP。当系统进行DUMP时,DUMP管理设施自动将内核相关的数据(kernel segment0及其他由内核或者内核扩展程序记录在主DUMP表中的内存块)复制到主DUMP设备。可以把DUMP理解为系统当时的一个快照,供以后分析,分析DUMP可以在其他机器上进行,但需要复制一份此机器的内核程序,即unix_64,没有对应于DUMP的内核程序是无法进行DUMP分析的。
有人曾比喻,DUMP产生的CORE文件就像飞机的“黑盒子“,神秘莫测,记录设备的一切资料,我们平时面对产生的core文件文件犹如看到天书。此外,还有一个难点在于普通用户拿到这个文件也是束手无策,内核的数据结构不够透明,大家看不懂,自然无法驾驭这个无比强大的工具。
在本次答疑活动中,您可以将曾经遇到的DUMP故障,或是案例分享出来;也可以将现在工作遇到的相关问题发到本次活动平台,社区将邀请多位答疑嘉宾来帮助您分析其中的缘由,帮助您解密AIX Dump Core文件。