drm/xe/guc_submit: fix race around pending_disable

author Matthew Auld <matthew.auld@intel.com>

Fri, 22 Nov 2024 16:19:16 +0000 (16:19 +0000)

committer Thomas Hellström <thomas.hellstrom@linux.intel.com>

Thu, 28 Nov 2024 14:22:20 +0000 (15:22 +0100)
author Matthew Auld <matthew.auld@intel.com>
Fri, 22 Nov 2024 16:19:16 +0000 (16:19 +0000)
committer Thomas Hellström <thomas.hellstrom@linux.intel.com>
Thu, 28 Nov 2024 14:22:20 +0000 (15:22 +0100)
diff --git a/drivers/gpu/drm/xe/xe_guc_submit.c b/drivers/gpu/drm/xe/xe_guc_submit.c

index 7afcc243037c8397d5c6db0b1581faa2d49657f4..ebc85d98b025349df51b85c9e8a1faa236b78d51 100644 (file)
--- a/drivers/gpu/drm/xe/xe_guc_submit.c
+++ b/drivers/gpu/drm/xe/xe_guc_submit.c
@@ -769,17 +769,19 @@ static void disable_scheduling_deregister(struct xe_guc *guc,
                                           struct xe_exec_queue *q)
  {
         MAKE_SCHED_CONTEXT_ACTION(q, DISABLE);
-       struct xe_device *xe = guc_to_xe(guc);
         int ret;
  
         set_min_preemption_timeout(guc, q);
         smp_rmb();
-       ret = wait_event_timeout(guc->ct.wq, !exec_queue_pending_enable(q) ||
-                                xe_guc_read_stopped(guc), HZ * 5);
+       ret = wait_event_timeout(guc->ct.wq,
+                                (!exec_queue_pending_enable(q) &&
+                                 !exec_queue_pending_disable(q)) ||
+                                        xe_guc_read_stopped(guc),
+                                HZ * 5);
         if (!ret) {
                 struct xe_gpu_scheduler *sched = &q->guc->sched;
  
-               drm_warn(&xe->drm, "Pending enable failed to respond");
+               xe_gt_warn(q->gt, "Pending enable/disable failed to respond\n");
                 xe_sched_submission_start(sched);
                 xe_gt_reset_async(q->gt);
                 xe_sched_tdr_queue_imm(sched);
@@ -1101,7 +1103,8 @@ guc_exec_queue_timedout_job(struct drm_sched_job *drm_job)
                          * modifying state
                          */
                         ret = wait_event_timeout(guc->ct.wq,
-                                                !exec_queue_pending_enable(q) ||
+                                                (!exec_queue_pending_enable(q) &&
+                                                 !exec_queue_pending_disable(q)) ||
                                                  xe_guc_read_stopped(guc), HZ * 5);
                         if (!ret || xe_guc_read_stopped(guc))
                                 goto trigger_reset;
@@ -1330,8 +1333,8 @@ static void __guc_exec_queue_process_msg_suspend(struct xe_sched_msg *msg)
  
         if (guc_exec_queue_allowed_to_change_state(q) && !exec_queue_suspended(q) &&
             exec_queue_enabled(q)) {
-               wait_event(guc->ct.wq, q->guc->resume_time != RESUME_PENDING ||
-                          xe_guc_read_stopped(guc));
+               wait_event(guc->ct.wq, (q->guc->resume_time != RESUME_PENDING ||
+                          xe_guc_read_stopped(guc)) && !exec_queue_pending_disable(q));
  
                 if (!xe_guc_read_stopped(guc)) {
                         s64 since_resume_ms =
author	Matthew Auld <matthew.auld@intel.com>
	Fri, 22 Nov 2024 16:19:16 +0000 (16:19 +0000)
committer	Thomas Hellström <thomas.hellstrom@linux.intel.com>
	Thu, 28 Nov 2024 14:22:20 +0000 (15:22 +0100)