]> www.infradead.org Git - users/mchehab/rasdaemon.git/commit
rasdaemon: Add support for post-processing MCA errors
authorAvadhut Naik <avadhut.naik@amd.com>
Mon, 22 May 2023 22:13:17 +0000 (22:13 +0000)
committerMauro Carvalho Chehab <mchehab@kernel.org>
Mon, 23 Oct 2023 09:27:18 +0000 (11:27 +0200)
commit932118b04a04104dfac6b8536419803f236e6118
tree49886259d332f41584b8c587844059424a6c8db4
parentaa36c96cd52d775570dae989dd95a060f1149077
rasdaemon: Add support for post-processing MCA errors

Currently, the rasdaemon performs detailed error decoding of received
MCA errors on the system only whence it is running, either as a daemon
or in the foreground.

As such, error decoding cannot be undertaken for any MCA errors received
whence the rasdaemon wasn't running. Additionally, if the error decoding
modules like edac_mce_amd too have not been loaded, error records in the
demsg buffer might correspond to raw values in associated MSRs, compelling
users to undertake decoding manually. The scenario seems more plausible on
AMD systems with Scalabale MCA (SMCA) with plans in place to remove SMCA
Extended Error Descriptions from the edac_mce_amd module in an effort to
offload SMCA Error Decoding to the rasdaemon.

As such, add support to post-process and decode MCA Errors received on AMD
SMCA systems from raw MSR values. Support for post-processing and decoding
of MCA Errors received on CPUs of other vendors can be added in the future,
as needed.

Suggested-by: Yazen Ghannam <yazen.ghannam@amd.com>
Signed-off-by: Avadhut Naik <avadhut.naik@amd.com>
Signed-off-by: Mauro Carvalho Chehab <mchehab@kernel.org>
README.md
mce-amd-smca.c
ras-events.h
ras-mce-handler.c
ras-mce-handler.h
ras-record.h
rasdaemon.c