]> www.infradead.org Git - users/jedix/linux-maple.git/commit
EDAC: Update memory repair control interface for memory sparing feature
authorShiju Jose <shiju.jose@huawei.com>
Mon, 24 Feb 2025 11:13:40 +0000 (12:13 +0100)
committerBorislav Petkov (AMD) <bp@alien8.de>
Wed, 26 Feb 2025 10:14:40 +0000 (11:14 +0100)
commit81e42fc1d3036efd45f66c03a79654fef00ef380
tree82225c7efa2341f3aa4f339f7f6c82eea24ab6e2
parent699ea5219c4b1d9d8819eb2d99e51a3fdb7b1d7b
EDAC: Update memory repair control interface for memory sparing feature

Update memory repair control interface for memory sparing feature.

CXL memory devices can support soft and hard memory sparing at cacheline,
row, bank and rank granularities. Memory sparing is defined as a repair
function that replaces a portion of memory with a portion of functional
memory at that same granularity.

When a CXL device detects an error in memory, it will report to the host
that there's need for a repair maintenance operation by using an event
record where the "maintenance needed" flag is set.

The event records contain the device physical address (DPA) and other
attributes of the memory to repair such as bank group, bank, rank, row,
column, channel etc.

The kernel will report the corresponding CXL general media or DRAM trace
event to userspace, and userspace tools (e.g. rasdaemon) will initiate
a repair operation in response to the device request via the sysfs
repair control.

  [ bp: Massage. ]

Signed-off-by: Shiju Jose <shiju.jose@huawei.com>
Signed-off-by: Borislav Petkov (AMD) <bp@alien8.de>
Link: https://lore.kernel.org/r/20250212143654.1893-15-shiju.jose@huawei.com
Documentation/ABI/testing/sysfs-edac-memory-repair
drivers/edac/mem_repair.c
include/linux/edac.h