CentOS7服务器报错,内容如下:
[0.1374880] [Firmware But]: the BIOS has corrupted hw-PMU resources (MRS 38d is b0) [2.073679] i8042:No controller found [2.076249] mce: Unable to init device /dev/mcelog (rc: -5) kdump: dump target is /dev/mapper/vg-lv_root kdump: saving to /sysroot/var/crash/127.0.0.1-2021-12-31-19:38:51/
想尽办法开机后,坚持不了多久又会挂掉,开启EDAC服务或加载EDAC内核模块后,在开机的间隙,检查了一下内存。
[root@33f ~]# grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
执行结果如下:
/sys/devices/system/edac/mc/mc0/csrow3/ch0_ce_count:9630 /sys/devices/system/edac/mc/mc0/csrow3/ch1_ce_count:0 /sys/devices/system/edac/mc/mc1/csrow2/ch0_ce_count:0 /sys/devices/system/edac/mc/mc1/csrow2/ch1_ce_count:20229
count不为0的行即代表存在内存错误。
mc*:第几个CPU控制器。
csrow*:内存通道。
ch*:通道内的第几根内存。
这时候可以判断mc0 3通道 0号内存 和 mc1 2号通道第一条内存故障,更换内存后,问题得到解决,顺利开机。
Copyright © 2013-2021 8a.hk All Rights Reserved. 八艾云 版权所有 中山市八艾云计算有限公司 粤ICP备14095776号