static void i915_oa_stream_destroy(struct i915_perf_stream *stream)
 {
        struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt = stream->engine->gt;
 
-       if (WARN_ON(stream != perf->exclusive_stream))
+       if (WARN_ON(stream != gt->perf.exclusive_stream))
                return;
 
        /*
         *
         * See i915_oa_init_reg_state() and lrc_configure_all_contexts()
         */
-       WRITE_ONCE(perf->exclusive_stream, NULL);
+       WRITE_ONCE(gt->perf.exclusive_stream, NULL);
        perf->ops.disable_metric_set(stream);
 
        free_oa_buffer(stream);
 {
        struct drm_i915_private *i915 = stream->perf->i915;
        struct intel_engine_cs *engine;
+       struct intel_gt *gt = stream->engine->gt;
        struct i915_gem_context *ctx, *cn;
        int err;
 
-       lockdep_assert_held(&stream->perf->lock);
+       lockdep_assert_held(>->perf.lock);
 
        /*
         * The OA register config is setup through the context image. This image
 {
        struct drm_i915_private *i915 = stream->perf->i915;
        struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt;
        int format_size;
        int ret;
 
                        "OA engine not specified\n");
                return -EINVAL;
        }
+       gt = props->engine->gt;
 
        /*
         * If the sysfs metrics/ directory wasn't registered for some
         * counter reports and marshal to the appropriate client
         * we currently only allow exclusive access
         */
-       if (perf->exclusive_stream) {
+       if (gt->perf.exclusive_stream) {
                drm_dbg(&stream->perf->i915->drm,
                        "OA unit already in use\n");
                return -EBUSY;
 
        stream->ops = &i915_oa_stream_ops;
 
-       perf->sseu = props->sseu;
-       WRITE_ONCE(perf->exclusive_stream, stream);
+       stream->engine->gt->perf.sseu = props->sseu;
+       WRITE_ONCE(gt->perf.exclusive_stream, stream);
 
        ret = i915_perf_stream_enable_sync(stream);
        if (ret) {
        return 0;
 
 err_enable:
-       WRITE_ONCE(perf->exclusive_stream, NULL);
+       WRITE_ONCE(gt->perf.exclusive_stream, NULL);
        perf->ops.disable_metric_set(stream);
 
        free_oa_buffer(stream);
                return;
 
        /* perf.exclusive_stream serialised by lrc_configure_all_contexts() */
-       stream = READ_ONCE(engine->i915->perf.exclusive_stream);
+       stream = READ_ONCE(engine->gt->perf.exclusive_stream);
        if (stream && GRAPHICS_VER(stream->perf->i915) < 12)
                gen8_update_reg_state_unlocked(ce, stream);
 }
                              loff_t *ppos)
 {
        struct i915_perf_stream *stream = file->private_data;
-       struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt = stream->engine->gt;
        size_t offset = 0;
        int ret;
 
                        if (ret)
                                return ret;
 
-                       mutex_lock(&perf->lock);
+                       mutex_lock(>->perf.lock);
                        ret = stream->ops->read(stream, buf, count, &offset);
-                       mutex_unlock(&perf->lock);
+                       mutex_unlock(>->perf.lock);
                } while (!offset && !ret);
        } else {
-               mutex_lock(&perf->lock);
+               mutex_lock(>->perf.lock);
                ret = stream->ops->read(stream, buf, count, &offset);
-               mutex_unlock(&perf->lock);
+               mutex_unlock(>->perf.lock);
        }
 
        /* We allow the poll checking to sometimes report false positive EPOLLIN
  * &i915_perf_stream_ops->poll_wait to call poll_wait() with a wait queue that
  * will be woken for new stream data.
  *
- * Note: The &perf->lock mutex has been taken to serialize
+ * Note: The >->perf.lock mutex has been taken to serialize
  * with any non-file-operation driver hooks.
  *
  * Returns: any poll events that are ready without sleeping
 static __poll_t i915_perf_poll(struct file *file, poll_table *wait)
 {
        struct i915_perf_stream *stream = file->private_data;
-       struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt = stream->engine->gt;
        __poll_t ret;
 
-       mutex_lock(&perf->lock);
+       mutex_lock(>->perf.lock);
        ret = i915_perf_poll_locked(stream, file, wait);
-       mutex_unlock(&perf->lock);
+       mutex_unlock(>->perf.lock);
 
        return ret;
 }
  * @cmd: the ioctl request
  * @arg: the ioctl data
  *
- * Note: The &perf->lock mutex has been taken to serialize
+ * Note: The >->perf.lock mutex has been taken to serialize
  * with any non-file-operation driver hooks.
  *
  * Returns: zero on success or a negative error code. Returns -EINVAL for
                            unsigned long arg)
 {
        struct i915_perf_stream *stream = file->private_data;
-       struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt = stream->engine->gt;
        long ret;
 
-       mutex_lock(&perf->lock);
+       mutex_lock(>->perf.lock);
        ret = i915_perf_ioctl_locked(stream, cmd, arg);
-       mutex_unlock(&perf->lock);
+       mutex_unlock(>->perf.lock);
 
        return ret;
 }
  * Frees all resources associated with the given i915 perf @stream, disabling
  * any associated data capture in the process.
  *
- * Note: The &perf->lock mutex has been taken to serialize
+ * Note: The >->perf.lock mutex has been taken to serialize
  * with any non-file-operation driver hooks.
  */
 static void i915_perf_destroy_locked(struct i915_perf_stream *stream)
 {
        struct i915_perf_stream *stream = file->private_data;
        struct i915_perf *perf = stream->perf;
+       struct intel_gt *gt = stream->engine->gt;
 
-       mutex_lock(&perf->lock);
+       mutex_lock(>->perf.lock);
        i915_perf_destroy_locked(stream);
-       mutex_unlock(&perf->lock);
+       mutex_unlock(>->perf.lock);
 
        /* Release the reference the perf stream kept on the driver. */
        drm_dev_put(&perf->i915->drm);
  * See i915_perf_ioctl_open() for interface details.
  *
  * Implements further stream config validation and stream initialization on
- * behalf of i915_perf_open_ioctl() with the &perf->lock mutex
+ * behalf of i915_perf_open_ioctl() with the >->perf.lock mutex
  * taken to serialize with any non-file-operation driver hooks.
  *
  * Note: at this point the @props have only been validated in isolation and
  * mutex to avoid an awkward lockdep with mmap_lock.
  *
  * Most of the implementation details are handled by
- * i915_perf_open_ioctl_locked() after taking the &perf->lock
+ * i915_perf_open_ioctl_locked() after taking the >->perf.lock
  * mutex for serializing with any non-file-operation driver hooks.
  *
  * Return: A newly opened i915 Perf stream file descriptor or negative
 {
        struct i915_perf *perf = &to_i915(dev)->perf;
        struct drm_i915_perf_open_param *param = data;
+       struct intel_gt *gt;
        struct perf_open_properties props;
        u32 known_open_flags;
        int ret;
        if (ret)
                return ret;
 
-       mutex_lock(&perf->lock);
+       gt = props.engine->gt;
+
+       mutex_lock(>->perf.lock);
        ret = i915_perf_open_ioctl_locked(perf, param, &props, file);
-       mutex_unlock(&perf->lock);
+       mutex_unlock(>->perf.lock);
 
        return ret;
 }
 void i915_perf_register(struct drm_i915_private *i915)
 {
        struct i915_perf *perf = &i915->perf;
+       struct intel_gt *gt = to_gt(i915);
 
        if (!perf->i915)
                return;
         * i915_perf_open_ioctl(); considering that we register after
         * being exposed to userspace.
         */
-       mutex_lock(&perf->lock);
+       mutex_lock(>->perf.lock);
 
        perf->metrics_kobj =
                kobject_create_and_add("metrics",
                                       &i915->drm.primary->kdev->kobj);
 
-       mutex_unlock(&perf->lock);
+       mutex_unlock(>->perf.lock);
 }
 
 /**
        }
 
        if (perf->ops.enable_metric_set) {
-               mutex_init(&perf->lock);
+               struct intel_gt *gt;
+               int i;
+
+               for_each_gt(gt, i915, i)
+                       mutex_init(>->perf.lock);
 
                /* Choose a representative limit */
                oa_sample_rate_hard_limit = to_gt(i915)->clock_frequency / 2;