关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

Linux 内存错误检查 EDAC检查内存错误No controller found

发布时间:2023-04-17 14:41:10
1491984010112764.jpg

CentOS7服务器报错,内容如下:

[0.1374880] [Firmware But]: the BIOS has corrupted hw-PMU resources (MRS 38d is b0)
[2.073679] i8042:No controller found
[2.076249] mce: Unable to init device /dev/mcelog (rc: -5)
kdump: dump target is /dev/mapper/vg-lv_root
kdump: saving to /sysroot/var/crash/127.0.0.1-2021-12-31-19:38:51/

想尽办法开机后,坚持不了多久又会挂掉,开启EDAC服务或加载EDAC内核模块后,在开机的间隙,检查了一下内存。

[root@33f ~]# grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count

执行结果如下:

/sys/devices/system/edac/mc/mc0/csrow3/ch0_ce_count:9630
/sys/devices/system/edac/mc/mc0/csrow3/ch1_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow2/ch0_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow2/ch1_ce_count:20229

count不为0的行即代表存在内存错误。
mc*:第几个CPU控制器。
csrow*:内存通道。
ch*:通道内的第几根内存。

这时候可以判断mc0 3通道 0号内存 和 mc1 2号通道第一条内存故障,更换内存后,问题得到解决,顺利开机。



/template/Home/8a/PC/Static