]> www.infradead.org Git - users/jedix/linux-maple.git/commit
EDAC/skx_common: Differentiate memory error sources
authorQiuxu Zhuo <qiuxu.zhuo@intel.com>
Tue, 15 Oct 2024 07:22:35 +0000 (15:22 +0800)
committerTony Luck <tony.luck@intel.com>
Wed, 23 Oct 2024 18:58:43 +0000 (11:58 -0700)
commit2397f795735219caa9c2fe61e7bcdd0652e670d3
tree5e276162a2fc29f75e440ee86ed78126689b1fb0
parentddb8a8a022b9733e50a353d1d09a95fcdb8d2b8f
EDAC/skx_common: Differentiate memory error sources

The current skx_common determines whether the memory error source is the
near memory of the 2LM system and then retrieves the decoded error results
from the ADXL components (near-memory vs. far-memory) accordingly.

However, some memory controllers may have limitations in correctly
reporting the memory error source, leading to the retrieval of incorrect
decoded parts from the ADXL.

To address these limitations, instead of simply determining whether the
memory error is from the near memory of the 2LM system, it is necessary to
distinguish the memory error source details as follows:

  Memory error from the near memory of the 2LM system.
  Memory error from the far memory of the 2LM system.
  Memory error from the 1LM system.
  Not a memory error.

This will enable the i10nm_edac driver to take appropriate actions for
those memory controllers that have limitations in reporting the memory
error source.

Fixes: ba987eaaabf9 ("EDAC/i10nm: Add Intel Granite Rapids server support")
Signed-off-by: Qiuxu Zhuo <qiuxu.zhuo@intel.com>
Signed-off-by: Tony Luck <tony.luck@intel.com>
Tested-by: Diego Garcia Rodriguez <diego.garcia.rodriguez@intel.com>
Link: https://lore.kernel.org/r/20241015072236.24543-2-qiuxu.zhuo@intel.com
drivers/edac/skx_common.c
drivers/edac/skx_common.h