]> www.infradead.org Git - nvme.git/commitdiff
drm/xe/lnl: Apply Wa_22019338487
authorVinay Belgaumkar <vinay.belgaumkar@intel.com>
Thu, 20 Jun 2024 22:49:27 +0000 (15:49 -0700)
committerRodrigo Vivi <rodrigo.vivi@intel.com>
Wed, 26 Jun 2024 22:23:45 +0000 (18:23 -0400)
This WA requires us to limit media GT frequency requests to a certain
cap value during driver load. Freq limits are restored after load
completes, so perf will not be affected during normal operations.

During normal driver operation, this WA requires dummy writes to media
offset 0x380D8C after every ~63 GGTT writes. This will ensure completion
of the LMEM writes originating from Gunit.

During driver unload(before FLR), the WA requires that we set requested
frequency to the cap value again.

v3: Do not use WA number in function name. Call WA wrapper from xe_device.
Rename some variables, check for locks in the correct function (Rodrigo).
Ensure reset path is also covered for this WA.

v4: Fix BAT failure

v5: Add a function pointer for ggtt_ops (Michal W)

v6: Fix name collision and use static function (Rodrigo)

Cc: Rodrigo Vivi <rodrigo.vivi@intel.com>
Reviewed-by: Rodrigo Vivi <rodrigo.vivi@intel.com>
Signed-off-by: Vinay Belgaumkar <vinay.belgaumkar@intel.com>
Link: https://patchwork.freedesktop.org/patch/msgid/20240620224928.3986377-2-vinay.belgaumkar@intel.com
Signed-off-by: Rodrigo Vivi <rodrigo.vivi@intel.com>
13 files changed:
drivers/gpu/drm/xe/Makefile
drivers/gpu/drm/xe/display/xe_fb_pin.c
drivers/gpu/drm/xe/xe_device.c
drivers/gpu/drm/xe/xe_ggtt.c
drivers/gpu/drm/xe/xe_ggtt.h
drivers/gpu/drm/xe/xe_ggtt_types.h
drivers/gpu/drm/xe/xe_gsc.c
drivers/gpu/drm/xe/xe_gt.c
drivers/gpu/drm/xe/xe_gt.h
drivers/gpu/drm/xe/xe_guc_pc.c
drivers/gpu/drm/xe/xe_guc_pc.h
drivers/gpu/drm/xe/xe_guc_pc_types.h
drivers/gpu/drm/xe/xe_wa_oob.rules

index 20dc9759bb3c7b4a3433a903d21d29c78165cfed..b1e03bfe4a68b6ed7b57312966b7a3d602e05793 100644 (file)
@@ -24,9 +24,12 @@ $(obj)/generated/%_wa_oob.c $(obj)/generated/%_wa_oob.h: $(obj)/xe_gen_wa_oob \
        $(call cmd,wa_oob)
 
 uses_generated_oob := \
+       $(obj)/xe_ggtt.o \
        $(obj)/xe_gsc.o \
+       $(obj)/xe_gt.o \
        $(obj)/xe_guc.o \
        $(obj)/xe_guc_ads.o \
+       $(obj)/xe_guc_pc.o \
        $(obj)/xe_migrate.o \
        $(obj)/xe_ring_ops.o \
        $(obj)/xe_vm.o \
index a2f4172091242b2db69e5a3686dd31893be9a369..d270bcd1168619ed059ddd210f66897cb068a267 100644 (file)
@@ -171,7 +171,7 @@ write_ggtt_rotated(struct xe_bo *bo, struct xe_ggtt *ggtt, u32 *ggtt_ofs, u32 bo
                        u64 pte = ggtt->pt_ops->pte_encode_bo(bo, src_idx * XE_PAGE_SIZE,
                                                              xe->pat.idx[XE_CACHE_NONE]);
 
-                       xe_ggtt_set_pte(ggtt, *ggtt_ofs, pte);
+                       ggtt->pt_ops->ggtt_set_pte(ggtt, *ggtt_ofs, pte);
                        *ggtt_ofs += XE_PAGE_SIZE;
                        src_idx -= src_stride;
                }
@@ -217,7 +217,7 @@ static int __xe_pin_fb_vma_ggtt(const struct intel_framebuffer *fb,
                        u64 pte = ggtt->pt_ops->pte_encode_bo(bo, x,
                                                              xe->pat.idx[XE_CACHE_NONE]);
 
-                       xe_ggtt_set_pte(ggtt, vma->node.start + x, pte);
+                       ggtt->pt_ops->ggtt_set_pte(ggtt, vma->node.start + x, pte);
                }
        } else {
                u32 i, ggtt_ofs;
index 0d57eea8f08363c6baf5cbc3c4a97db056c2e623..ca5e8435485a0767a4fa2f8955d105979effb32e 100644 (file)
@@ -689,6 +689,9 @@ int xe_device_probe(struct xe_device *xe)
 
        xe_hwmon_register(xe);
 
+       for_each_gt(gt, xe, id)
+               xe_gt_sanitize_freq(gt);
+
        return devm_add_action_or_reset(xe->drm.dev, xe_device_sanitize, xe);
 
 err_fini_display:
index 8ff91fd1b7c8015c49cbbe5e144ddca79b1bc14f..883cfc7f98a8e249a4a927d8668eea5891e4cdc4 100644 (file)
@@ -11,6 +11,7 @@
 #include <drm/drm_drv.h>
 #include <drm/drm_managed.h>
 #include <drm/intel/i915_drm.h>
+#include <generated/xe_wa_oob.h>
 
 #include "regs/xe_gt_regs.h"
 #include "regs/xe_gtt_defs.h"
 #include "xe_gt_sriov_vf.h"
 #include "xe_gt_tlb_invalidation.h"
 #include "xe_map.h"
+#include "xe_mmio.h"
 #include "xe_pm.h"
 #include "xe_sriov.h"
+#include "xe_wa.h"
 #include "xe_wopcm.h"
 
 static u64 xelp_ggtt_pte_encode_bo(struct xe_bo *bo, u64 bo_offset,
@@ -69,7 +72,22 @@ static unsigned int probe_gsm_size(struct pci_dev *pdev)
        return ggms ? SZ_1M << ggms : 0;
 }
 
-void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte)
+static void ggtt_update_access_counter(struct xe_ggtt *ggtt)
+{
+       /*
+        * Wa_22019338487: GMD_ID is a RO register, a dummy write forces gunit
+        * to wait for completion of prior GTT writes before letting this through.
+        * This needs to be done for all GGTT writes originating from the CPU.
+        */
+       lockdep_assert_held(&ggtt->lock);
+
+       if ((++ggtt->access_count % 63) == 0) {
+               xe_mmio_write32(ggtt->tile->media_gt, GMD_ID, 0x0);
+               ggtt->access_count = 0;
+       }
+}
+
+static void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte)
 {
        xe_tile_assert(ggtt->tile, !(addr & XE_PTE_MASK));
        xe_tile_assert(ggtt->tile, addr < ggtt->size);
@@ -77,6 +95,12 @@ void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte)
        writeq(pte, &ggtt->gsm[addr >> XE_PTE_SHIFT]);
 }
 
+static void xe_ggtt_set_pte_and_flush(struct xe_ggtt *ggtt, u64 addr, u64 pte)
+{
+       xe_ggtt_set_pte(ggtt, addr, pte);
+       ggtt_update_access_counter(ggtt);
+}
+
 static void xe_ggtt_clear(struct xe_ggtt *ggtt, u64 start, u64 size)
 {
        u16 pat_index = tile_to_xe(ggtt->tile)->pat.idx[XE_CACHE_WB];
@@ -92,7 +116,7 @@ static void xe_ggtt_clear(struct xe_ggtt *ggtt, u64 start, u64 size)
                scratch_pte = 0;
 
        while (start < end) {
-               xe_ggtt_set_pte(ggtt, start, scratch_pte);
+               ggtt->pt_ops->ggtt_set_pte(ggtt, start, scratch_pte);
                start += XE_PAGE_SIZE;
        }
 }
@@ -124,10 +148,17 @@ static void primelockdep(struct xe_ggtt *ggtt)
 
 static const struct xe_ggtt_pt_ops xelp_pt_ops = {
        .pte_encode_bo = xelp_ggtt_pte_encode_bo,
+       .ggtt_set_pte = xe_ggtt_set_pte,
 };
 
 static const struct xe_ggtt_pt_ops xelpg_pt_ops = {
        .pte_encode_bo = xelpg_ggtt_pte_encode_bo,
+       .ggtt_set_pte = xe_ggtt_set_pte,
+};
+
+static const struct xe_ggtt_pt_ops xelpg_pt_wa_ops = {
+       .pte_encode_bo = xelpg_ggtt_pte_encode_bo,
+       .ggtt_set_pte = xe_ggtt_set_pte_and_flush,
 };
 
 /*
@@ -187,7 +218,8 @@ int xe_ggtt_init_early(struct xe_ggtt *ggtt)
                ggtt->size = GUC_GGTT_TOP;
 
        if (GRAPHICS_VERx100(xe) >= 1270)
-               ggtt->pt_ops = &xelpg_pt_ops;
+               ggtt->pt_ops = ggtt->tile->media_gt && XE_WA(ggtt->tile->media_gt, 22019338487) ?
+                              &xelpg_pt_wa_ops : &xelpg_pt_ops;
        else
                ggtt->pt_ops = &xelp_pt_ops;
 
@@ -394,7 +426,7 @@ void xe_ggtt_map_bo(struct xe_ggtt *ggtt, struct xe_bo *bo)
 
        for (offset = 0; offset < bo->size; offset += XE_PAGE_SIZE) {
                pte = ggtt->pt_ops->pte_encode_bo(bo, offset, pat_index);
-               xe_ggtt_set_pte(ggtt, start + offset, pte);
+               ggtt->pt_ops->ggtt_set_pte(ggtt, start + offset, pte);
        }
 }
 
@@ -502,7 +534,7 @@ static void xe_ggtt_assign_locked(struct xe_ggtt *ggtt, const struct drm_mm_node
                return;
 
        while (start < end) {
-               xe_ggtt_set_pte(ggtt, start, pte);
+               ggtt->pt_ops->ggtt_set_pte(ggtt, start, pte);
                start += XE_PAGE_SIZE;
        }
 
index 4a41a1762358ac0a0043f7a7c7c3e3ca130a5016..6a96fd54bf60f735671d0a9f5afd7c83c3ce50c1 100644 (file)
@@ -10,7 +10,6 @@
 
 struct drm_printer;
 
-void xe_ggtt_set_pte(struct xe_ggtt *ggtt, u64 addr, u64 pte);
 int xe_ggtt_init_early(struct xe_ggtt *ggtt);
 int xe_ggtt_init(struct xe_ggtt *ggtt);
 void xe_ggtt_printk(struct xe_ggtt *ggtt, const char *prefix);
index d8c584d9a8c3ff978de22550c2c93c8e1cc8605a..2245d88d8f39452c1451535cbf9f1bf675cc98ea 100644 (file)
 struct xe_bo;
 struct xe_gt;
 
-struct xe_ggtt_pt_ops {
-       u64 (*pte_encode_bo)(struct xe_bo *bo, u64 bo_offset, u16 pat_index);
-};
-
 struct xe_ggtt {
        struct xe_tile *tile;
 
@@ -34,6 +30,14 @@ struct xe_ggtt {
        const struct xe_ggtt_pt_ops *pt_ops;
 
        struct drm_mm mm;
+
+       /** @access_count: counts GGTT writes */
+       unsigned int access_count;
+};
+
+struct xe_ggtt_pt_ops {
+       u64 (*pte_encode_bo)(struct xe_bo *bo, u64 bo_offset, u16 pat_index);
+       void (*ggtt_set_pte)(struct xe_ggtt *ggtt, u64 addr, u64 pte);
 };
 
 #endif
index 80a61934deccaac960314881d7879a58ba23cffe..f8239a13fa2b882f2fb8245f88abb2c53ad3d9b2 100644 (file)
@@ -22,6 +22,7 @@
 #include "xe_gt.h"
 #include "xe_gt_mcr.h"
 #include "xe_gt_printk.h"
+#include "xe_guc_pc.h"
 #include "xe_huc.h"
 #include "xe_map.h"
 #include "xe_mmio.h"
@@ -284,6 +285,10 @@ static int gsc_upload_and_init(struct xe_gsc *gsc)
                return ret;
 
        xe_uc_fw_change_status(&gsc->fw, XE_UC_FIRMWARE_TRANSFERRED);
+
+       /* GSC load is done, restore expected GT frequencies */
+       xe_gt_sanitize_freq(gt);
+
        xe_gt_dbg(gt, "GSC FW async load completed\n");
 
        /* HuC auth failure is not fatal */
index 57d84751e160d6c8ed28ed986046f3f29beab91f..759634cff1d8a6333a4c8c6163f8b0afc39cbdec 100644 (file)
@@ -9,6 +9,7 @@
 
 #include <drm/drm_managed.h>
 #include <drm/xe_drm.h>
+#include <generated/xe_wa_oob.h>
 
 #include "instructions/xe_gfxpipe_commands.h"
 #include "instructions/xe_mi_commands.h"
@@ -54,6 +55,7 @@
 #include "xe_sriov.h"
 #include "xe_tuning.h"
 #include "xe_uc.h"
+#include "xe_uc_fw.h"
 #include "xe_vm.h"
 #include "xe_wa.h"
 #include "xe_wopcm.h"
@@ -678,6 +680,9 @@ static int do_gt_restart(struct xe_gt *gt)
        /* Get CCS mode in sync between sw/hw */
        xe_gt_apply_ccs_mode(gt);
 
+       /* Restore GT freq to expected values */
+       xe_gt_sanitize_freq(gt);
+
        return 0;
 }
 
@@ -801,6 +806,25 @@ err_msg:
        return err;
 }
 
+/**
+ * xe_gt_sanitize_freq() - Restore saved frequencies if necessary.
+ * @gt: the GT object
+ *
+ * Called after driver init/GSC load completes to restore GT frequencies if we
+ * limited them for any WAs.
+ */
+int xe_gt_sanitize_freq(struct xe_gt *gt)
+{
+       int ret = 0;
+
+       if ((!xe_uc_fw_is_available(&gt->uc.gsc.fw) ||
+           xe_uc_fw_is_loaded(&gt->uc.gsc.fw)) &&
+           XE_WA(gt, 22019338487))
+               ret = xe_guc_pc_restore_stashed_freq(&gt->uc.guc.pc);
+
+       return ret;
+}
+
 int xe_gt_resume(struct xe_gt *gt)
 {
        int err;
index 9073ac68a7771a1203271526d8c22a8d4f445133..1123fdfc4ebc17157fc00ee05d9cd57b49d57b3b 100644 (file)
@@ -56,6 +56,7 @@ int xe_gt_suspend(struct xe_gt *gt);
 int xe_gt_resume(struct xe_gt *gt);
 void xe_gt_reset_async(struct xe_gt *gt);
 void xe_gt_sanitize(struct xe_gt *gt);
+int xe_gt_sanitize_freq(struct xe_gt *gt);
 void xe_gt_remove(struct xe_gt *gt);
 
 /**
index 2b45a9cd3ec020b683215e7136f63e8e1b7a34aa..edf4a29a2aa313120671cdce7f52b81ee5ba1713 100644 (file)
@@ -8,6 +8,7 @@
 #include <linux/delay.h>
 
 #include <drm/drm_managed.h>
+#include <generated/xe_wa_oob.h>
 
 #include "abi/guc_actions_slpc_abi.h"
 #include "regs/xe_gt_regs.h"
@@ -25,6 +26,7 @@
 #include "xe_mmio.h"
 #include "xe_pcode.h"
 #include "xe_pm.h"
+#include "xe_wa.h"
 
 #define MCHBAR_MIRROR_BASE_SNB 0x140000
 
@@ -42,6 +44,8 @@
 #define GT_FREQUENCY_MULTIPLIER        50
 #define GT_FREQUENCY_SCALER    3
 
+#define LNL_MERT_FREQ_CAP      800
+
 /**
  * DOC: GuC Power Conservation (PC)
  *
@@ -695,6 +699,16 @@ static void pc_init_fused_rp_values(struct xe_guc_pc *pc)
                tgl_init_fused_rp_values(pc);
 }
 
+static u32 pc_max_freq_cap(struct xe_guc_pc *pc)
+{
+       struct xe_gt *gt = pc_to_gt(pc);
+
+       if (XE_WA(gt, 22019338487))
+               return min(LNL_MERT_FREQ_CAP, pc->rp0_freq);
+       else
+               return pc->rp0_freq;
+}
+
 /**
  * xe_guc_pc_init_early - Initialize RPx values and request a higher GT
  * frequency to allow faster GuC load times
@@ -706,7 +720,7 @@ void xe_guc_pc_init_early(struct xe_guc_pc *pc)
 
        xe_force_wake_assert_held(gt_to_fw(gt), XE_FW_GT);
        pc_init_fused_rp_values(pc);
-       pc_set_cur_freq(pc, pc->rp0_freq);
+       pc_set_cur_freq(pc, pc_max_freq_cap(pc));
 }
 
 static int pc_adjust_freq_bounds(struct xe_guc_pc *pc)
@@ -762,6 +776,53 @@ static int pc_adjust_requested_freq(struct xe_guc_pc *pc)
        return ret;
 }
 
+static int pc_set_mert_freq_cap(struct xe_guc_pc *pc)
+{
+       int ret = 0;
+
+       if (XE_WA(pc_to_gt(pc), 22019338487)) {
+               /*
+                * Get updated min/max and stash them.
+                */
+               ret = xe_guc_pc_get_min_freq(pc, &pc->stashed_min_freq);
+               if (!ret)
+                       ret = xe_guc_pc_get_max_freq(pc, &pc->stashed_max_freq);
+               if (ret)
+                       return ret;
+
+               /*
+                * Ensure min and max are bound by MERT_FREQ_CAP until driver loads.
+                */
+               mutex_lock(&pc->freq_lock);
+               ret = pc_set_min_freq(pc, min(pc->rpe_freq, pc_max_freq_cap(pc)));
+               if (!ret)
+                       ret = pc_set_max_freq(pc, min(pc->rp0_freq, pc_max_freq_cap(pc)));
+               mutex_unlock(&pc->freq_lock);
+       }
+
+       return ret;
+}
+
+/**
+ * xe_guc_pc_restore_stashed_freq - Set min/max back to stashed values
+ * @pc: The GuC PC
+ *
+ * Returns: 0 on success,
+ *          error code on failure
+ */
+int xe_guc_pc_restore_stashed_freq(struct xe_guc_pc *pc)
+{
+       int ret = 0;
+
+       mutex_lock(&pc->freq_lock);
+       ret = pc_set_max_freq(pc, pc->stashed_max_freq);
+       if (!ret)
+               ret = pc_set_min_freq(pc, pc->stashed_min_freq);
+       mutex_unlock(&pc->freq_lock);
+
+       return ret;
+}
+
 /**
  * xe_guc_pc_gucrc_disable - Disable GuC RC
  * @pc: Xe_GuC_PC instance
@@ -911,6 +972,10 @@ int xe_guc_pc_start(struct xe_guc_pc *pc)
        if (ret)
                goto out;
 
+       ret = pc_set_mert_freq_cap(pc);
+       if (ret)
+               goto out;
+
        if (xe->info.platform == XE_PVC) {
                xe_guc_pc_gucrc_disable(pc);
                ret = 0;
@@ -959,6 +1024,10 @@ static void xe_guc_pc_fini_hw(void *arg)
        XE_WARN_ON(xe_force_wake_get(gt_to_fw(pc_to_gt(pc)), XE_FORCEWAKE_ALL));
        XE_WARN_ON(xe_guc_pc_gucrc_disable(pc));
        XE_WARN_ON(xe_guc_pc_stop(pc));
+
+       /* Bind requested freq to mert_freq_cap before unload */
+       pc_set_cur_freq(pc, min(pc_max_freq_cap(pc), pc->rpe_freq));
+
        xe_force_wake_put(gt_to_fw(pc_to_gt(pc)), XE_FORCEWAKE_ALL);
 }
 
index 8a7b91ce1b3ed681967a33374b477290e3032aad..55fdb55ab68829e80ed7d8d653dba286028d62d4 100644 (file)
@@ -32,5 +32,6 @@ enum xe_gt_idle_state xe_guc_pc_c_status(struct xe_guc_pc *pc);
 u64 xe_guc_pc_rc6_residency(struct xe_guc_pc *pc);
 u64 xe_guc_pc_mc6_residency(struct xe_guc_pc *pc);
 void xe_guc_pc_init_early(struct xe_guc_pc *pc);
+int xe_guc_pc_restore_stashed_freq(struct xe_guc_pc *pc);
 
 #endif /* _XE_GUC_PC_H_ */
index 2afd0dbc354268cadf9ca66c4984862c57a4a924..13810be015db5496039d7363bbbebdb8e63ef711 100644 (file)
@@ -25,6 +25,10 @@ struct xe_guc_pc {
        u32 user_requested_min;
        /** @user_requested_max: Stash the maximum requested freq by user */
        u32 user_requested_max;
+       /** @stashed_min_freq: Stash the current minimum freq */
+       u32 stashed_min_freq;
+       /** @stashed_max_freq: Stash the current maximum freq */
+       u32 stashed_max_freq;
        /** @freq_lock: Let's protect the frequencies */
        struct mutex freq_lock;
        /** @freq_ready: Only handle freq changes, if they are really ready */
index 12fe88796a497021def1f83e02531cfbde013f81..a6b897030fdebb17ef3b93e147e9e2bfa849cff3 100644 (file)
@@ -27,3 +27,4 @@
 16022287689    GRAPHICS_VERSION(2001)
                GRAPHICS_VERSION(2004)
 13011645652    GRAPHICS_VERSION(2004)
+22019338487    MEDIA_VERSION(2000)