]> www.infradead.org Git - linux.git/commitdiff
drm/amd/sriov: extend NV_MAILBOX_POLL_MSG_TIMEDOUT
authorVictor Zhao <Victor.Zhao@amd.com>
Wed, 7 Aug 2024 09:32:27 +0000 (17:32 +0800)
committerAlex Deucher <alexander.deucher@amd.com>
Tue, 13 Aug 2024 16:12:51 +0000 (12:12 -0400)
on MI300/MI308 UBB products, when doing mode1 reset, since 1 gpu need to
wait all 8 gpus finish mode1 reset and then do re-init. As observed,
sometimes the gpu which triggered the reset need to wait 15s for all
gpus to finish.

If poll msg timeout, guest driver will send the reset message again, and
may mess up the following reinit sequence on other gpus.

So extend the time to cover the maximum time needed to recover.

Signed-off-by: Victor Zhao <Victor.Zhao@amd.com>
Acked-by: Alex Deucher <alexander.deucher@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
drivers/gpu/drm/amd/amdgpu/mxgpu_nv.h

index caf616a2c8a6c52db903c5ad11aed1643596723f..1d099ffb3a5a2cc01f3eed2565c9a77cf95d987b 100644 (file)
@@ -25,7 +25,7 @@
 #define __MXGPU_NV_H__
 
 #define NV_MAILBOX_POLL_ACK_TIMEDOUT   500
-#define NV_MAILBOX_POLL_MSG_TIMEDOUT   6000
+#define NV_MAILBOX_POLL_MSG_TIMEDOUT   15000
 #define NV_MAILBOX_POLL_FLR_TIMEDOUT   10000
 #define NV_MAILBOX_POLL_MSG_REP_MAX    11