]> www.infradead.org Git - users/hch/xfs.git/commitdiff
drm/xe: Add support for CCS engine fusing
authorMatt Roper <matthew.d.roper@intel.com>
Thu, 9 Mar 2023 00:55:30 +0000 (16:55 -0800)
committerRodrigo Vivi <rodrigo.vivi@intel.com>
Tue, 19 Dec 2023 23:29:45 +0000 (18:29 -0500)
For Xe_HP platforms that can have multiple CCS engines, the
presence/absence of each CCS is inferred by the presence/absence of any
DSS in the corresponding quadrant of the GT's DSS mask.

This handling is only needed on platforms that can have more than one
CCS.  The CCS is never fused off on platforms like MTL that can only
have one.

v2:
 - Add extra warnings to try to catch mistakes where the register counts
   in get_num_dss_regs() are updated without corresponding updates to
   the register parameters passed to load_dss_mask().  (Lucas)
 - Add kerneldoc for xe_gt_topology_has_dss_in_quadrant() and clarify
   why we care about quadrants of the DSS space.  (Lucas)
 - Ensure CCS engine counting treats engine mask as 64-bit.  (Lucas)

Cc: Lucas De Marchi <lucas.demarchi@intel.com>
Reviewed-by: Lucas De Marchi <lucas.demarchi@intel.com>
Link: https://lore.kernel.org/r/20230309005530.3140173-2-matthew.d.roper@intel.com
Signed-off-by: Matt Roper <matthew.d.roper@intel.com>
Signed-off-by: Rodrigo Vivi <rodrigo.vivi@intel.com>
drivers/gpu/drm/xe/xe_gt_topology.c
drivers/gpu/drm/xe/xe_gt_topology.h
drivers/gpu/drm/xe/xe_hw_engine.c

index 2123f84be336e56b85ed6c1089b1e6ff8d592ecc..f2cbee53462b135fca4d17cfc1354601102cb620 100644 (file)
@@ -62,6 +62,21 @@ load_eu_mask(struct xe_gt *gt, xe_eu_mask_t mask)
        bitmap_from_arr32(mask, &val, XE_MAX_EU_FUSE_BITS);
 }
 
+static void
+get_num_dss_regs(struct xe_device *xe, int *geometry_regs, int *compute_regs)
+{
+       if (GRAPHICS_VERx100(xe) == 1260) {
+               *geometry_regs = 0;
+               *compute_regs = 2;
+       } else if (GRAPHICS_VERx100(xe) >= 1250) {
+               *geometry_regs = 1;
+               *compute_regs = 1;
+       } else {
+               *geometry_regs = 1;
+               *compute_regs = 0;
+       }
+}
+
 void
 xe_gt_topology_init(struct xe_gt *gt)
 {
@@ -69,18 +84,17 @@ xe_gt_topology_init(struct xe_gt *gt)
        struct drm_printer p = drm_debug_printer("GT topology");
        int num_geometry_regs, num_compute_regs;
 
-       if (GRAPHICS_VERx100(xe) == 1260) {
-               num_geometry_regs = 0;
-               num_compute_regs = 2;
-       } else if (GRAPHICS_VERx100(xe) >= 1250) {
-               num_geometry_regs = 1;
-               num_compute_regs = 1;
-       } else {
-               num_geometry_regs = 1;
-               num_compute_regs = 0;
-       }
+       get_num_dss_regs(xe, &num_geometry_regs, &num_compute_regs);
 
-       load_dss_mask(gt, gt->fuse_topo.g_dss_mask, num_geometry_regs,
+       /*
+        * Register counts returned shouldn't exceed the number of registers
+        * passed as parameters below.
+        */
+       drm_WARN_ON(&xe->drm, num_geometry_regs > 1);
+       drm_WARN_ON(&xe->drm, num_compute_regs > 2);
+
+       load_dss_mask(gt, gt->fuse_topo.g_dss_mask,
+                     num_geometry_regs,
                      XELP_GT_GEOMETRY_DSS_ENABLE.reg);
        load_dss_mask(gt, gt->fuse_topo.c_dss_mask, num_compute_regs,
                      XEHP_GT_COMPUTE_DSS_ENABLE.reg,
@@ -113,3 +127,32 @@ xe_dss_mask_group_ffs(xe_dss_mask_t mask, int groupsize, int groupnum)
 {
        return find_next_bit(mask, XE_MAX_DSS_FUSE_BITS, groupnum * groupsize);
 }
+
+/**
+ * xe_gt_topology_has_dss_in_quadrant - check fusing of DSS in GT quadrant
+ * @gt: GT to check
+ * @quad: Which quadrant of the DSS space to check
+ *
+ * Since Xe_HP platforms can have up to four CCS engines, those engines
+ * are each logically associated with a quarter of the possible DSS.  If there
+ * are no DSS present in one of the four quadrants of the DSS space, the
+ * corresponding CCS engine is also not available for use.
+ *
+ * Returns false if all DSS in a quadrant of the GT are fused off, else true.
+ */
+bool xe_gt_topology_has_dss_in_quadrant(struct xe_gt *gt, int quad)
+{
+       struct xe_device *xe = gt_to_xe(gt);
+       xe_dss_mask_t all_dss;
+       int g_dss_regs, c_dss_regs, dss_per_quad, quad_first;
+
+       bitmap_or(all_dss, gt->fuse_topo.g_dss_mask, gt->fuse_topo.c_dss_mask,
+                 XE_MAX_DSS_FUSE_BITS);
+
+       get_num_dss_regs(xe, &g_dss_regs, &c_dss_regs);
+       dss_per_quad = 32 * max(g_dss_regs, c_dss_regs) / 4;
+
+       quad_first = xe_dss_mask_group_ffs(all_dss, dss_per_quad, quad);
+
+       return quad_first < (quad + 1) * dss_per_quad;
+}
index b2540dc266f217e2311e01d668020630e510ebe3..f47ab1b1269c7c4e7a413fe997ca8ea92f6fd246 100644 (file)
@@ -17,4 +17,7 @@ void xe_gt_topology_dump(struct xe_gt *gt, struct drm_printer *p);
 unsigned int
 xe_dss_mask_group_ffs(xe_dss_mask_t mask, int groupsize, int groupnum);
 
+bool
+xe_gt_topology_has_dss_in_quadrant(struct xe_gt *gt, int quad);
+
 #endif /* _XE_GT_TOPOLOGY_H_ */
index abfd35491b478f74ef14a281ab49a430bb0af67f..63a4efd5edccd5fc323d98b76b426829f8c66135 100644 (file)
@@ -436,13 +436,40 @@ static void read_copy_fuses(struct xe_gt *gt)
        }
 }
 
+static void read_compute_fuses(struct xe_gt *gt)
+{
+       struct xe_device *xe = gt_to_xe(gt);
+
+       /*
+        * CCS fusing based on DSS masks only applies to platforms that can
+        * have more than one CCS.
+        */
+       if (hweight64(gt->info.engine_mask &
+                     GENMASK_ULL(XE_HW_ENGINE_CCS3, XE_HW_ENGINE_CCS0)) <= 1)
+               return;
+
+       /*
+        * CCS availability on Xe_HP is inferred from the presence of DSS in
+        * each quadrant.
+        */
+       for (int i = XE_HW_ENGINE_CCS0, j = 0; i <= XE_HW_ENGINE_CCS3; ++i, ++j) {
+               if (!(gt->info.engine_mask & BIT(i)))
+                       continue;
+
+               if (!xe_gt_topology_has_dss_in_quadrant(gt, j)) {
+                       gt->info.engine_mask &= ~BIT(i);
+                       drm_info(&xe->drm, "ccs%u fused off\n", j);
+               }
+       }
+}
+
 int xe_hw_engines_init_early(struct xe_gt *gt)
 {
        int i;
 
        read_media_fuses(gt);
        read_copy_fuses(gt);
-       /* TODO: compute engines */
+       read_compute_fuses(gt);
 
        for (i = 0; i < ARRAY_SIZE(gt->hw_engines); i++)
                hw_engine_init_early(gt, &gt->hw_engines[i], i);