--- /dev/null
+/* SPDX-License-Identifier: MIT */
+/*
+ * Copyright © 2023 Intel Corporation
+ */
+
+#ifndef _XE_INSTR_DEFS_H_
+#define _XE_INSTR_DEFS_H_
+
+#include "regs/xe_reg_defs.h"
+
+/*
+ * The first dword of any GPU instruction is the "instruction header."  Bits
+ * 31:29 identify the general type of the command and determine how exact
+ * opcodes and sub-opcodes will be encoded in the remaining bits.
+ */
+#define XE_INSTR_CMD_TYPE              GENMASK(31, 29)
+#define   XE_INSTR_MI                  REG_FIELD_PREP(XE_INSTR_CMD_TYPE, 0x0)
+
+/*
+ * Most (but not all) instructions have a "length" field in the instruction
+ * header.  The value expected is the total number of dwords for the
+ * instruction, minus two.
+ *
+ * Some instructions have length fields longer or shorter than 8 bits, but
+ * those are rare.  This definition can be used for the common case where
+ * the length field is from 7:0.
+ */
+#define XE_INSTR_LEN_MASK              GENMASK(7, 0)
+#define XE_INSTR_NUM_DW(x)             REG_FIELD_PREP(XE_INSTR_LEN_MASK, (x) - 2)
+
+#endif
 
--- /dev/null
+/* SPDX-License-Identifier: MIT */
+/*
+ * Copyright © 2023 Intel Corporation
+ */
+
+#ifndef _XE_MI_COMMANDS_H_
+#define _XE_MI_COMMANDS_H_
+
+#include "instructions/xe_instr_defs.h"
+
+/*
+ * MI (Memory Interface) commands are supported by all GT engines.  They
+ * provide general memory operations and command streamer control.  MI commands
+ * have a command type of 0x0 (MI_COMMAND) in bits 31:29 of the instruction
+ * header dword and a specific MI opcode in bits 28:23.
+ */
+
+#define MI_OPCODE                      REG_GENMASK(28, 23)
+#define MI_SUBOPCODE                   REG_GENMASK(22, 17)  /* used with MI_EXPANSION */
+
+#define __MI_INSTR(opcode) \
+       (XE_INSTR_MI | REG_FIELD_PREP(MI_OPCODE, opcode))
+
+#define MI_NOOP                                __MI_INSTR(0x0)
+#define MI_USER_INTERRUPT              __MI_INSTR(0x2)
+#define MI_ARB_CHECK                   __MI_INSTR(0x5)
+
+#define MI_ARB_ON_OFF                  __MI_INSTR(0x8)
+#define   MI_ARB_ENABLE                        REG_BIT(0)
+#define   MI_ARB_DISABLE               0x0
+
+#define MI_BATCH_BUFFER_END            __MI_INSTR(0xA)
+#define MI_STORE_DATA_IMM              __MI_INSTR(0x20)
+#define   MI_SDI_GGTT                  REG_BIT(22)
+#define   MI_SDI_LEN_DW                        GENMASK(9, 0)
+#define   MI_SDI_NUM_DW(x)             REG_FIELD_PREP(MI_SDI_LEN_DW, (x) + 3 - 2)
+#define   MI_SDI_NUM_QW(x)             (REG_FIELD_PREP(MI_SDI_LEN_DW, 2 * (x) + 3 - 2) | \
+                                        REG_BIT(21))
+
+#define MI_LOAD_REGISTER_IMM           __MI_INSTR(0x22)
+#define   MI_LRI_LRM_CS_MMIO           REG_BIT(19)
+#define   MI_LRI_MMIO_REMAP_EN         REG_BIT(17)
+#define   MI_LRI_NUM_REGS(x)           XE_INSTR_NUM_DW(2 * (x) + 1)
+#define   MI_LRI_FORCE_POSTED          REG_BIT(12)
+
+#define MI_FLUSH_DW                    __MI_INSTR(0x26)
+#define   MI_FLUSH_DW_STORE_INDEX      REG_BIT(21)
+#define   MI_INVALIDATE_TLB            REG_BIT(18)
+#define   MI_FLUSH_DW_CCS              REG_BIT(16)
+#define   MI_FLUSH_DW_OP_STOREDW       REG_BIT(14)
+#define   MI_FLUSH_DW_LEN_DW           REG_GENMASK(5, 0)
+#define   MI_FLUSH_IMM_DW              REG_FIELD_PREP(MI_FLUSH_DW_LEN_DW, 4 - 2)
+#define   MI_FLUSH_IMM_QW              REG_FIELD_PREP(MI_FLUSH_DW_LEN_DW, 5 - 2)
+#define   MI_FLUSH_DW_USE_GTT          REG_BIT(2)
+
+#define MI_BATCH_BUFFER_START          __MI_INSTR(0x31)
+
+#endif
 
 
 #include "regs/xe_reg_defs.h"
 
-#define INSTR_CLIENT_SHIFT      29
-#define   INSTR_MI_CLIENT       0x0
-#define __INSTR(client) ((client) << INSTR_CLIENT_SHIFT)
-
-#define MI_INSTR(opcode, flags) \
-       (__INSTR(INSTR_MI_CLIENT) | (opcode) << 23 | (flags))
-
-#define MI_NOOP                        MI_INSTR(0, 0)
-#define MI_USER_INTERRUPT      MI_INSTR(0x02, 0)
-
-#define MI_ARB_ON_OFF          MI_INSTR(0x08, 0)
-#define   MI_ARB_ENABLE                        (1<<0)
-#define   MI_ARB_DISABLE               (0<<0)
-
-#define MI_BATCH_BUFFER_END    MI_INSTR(0x0a, 0)
-#define MI_STORE_DATA_IMM      MI_INSTR(0x20, 0)
-#define   MI_SDI_GGTT          REG_BIT(22)
-#define   MI_SDI_NUM_DW(x)     ((x) + 1)
-#define   MI_SDI_NUM_QW(x)     (REG_BIT(21) | (2 * (x) + 1))
-
-#define MI_LOAD_REGISTER_IMM   MI_INSTR(0x22, 0)
-#define   MI_LRI_LRM_CS_MMIO           REG_BIT(19)
-#define   MI_LRI_MMIO_REMAP_EN         REG_BIT(17)
-#define   MI_LRI_LENGTH                        GENMASK(5, 0)
-#define   MI_LRI_NUM_REGS(x)           REG_FIELD_PREP(MI_LRI_LENGTH, 2 * (x) - 1)
-#define   MI_LRI_FORCE_POSTED          (1<<12)
-
-#define MI_FLUSH_DW            MI_INSTR(0x26, 0)
-#define   MI_FLUSH_DW_STORE_INDEX      (1<<21)
-#define   MI_INVALIDATE_TLB            (1<<18)
-#define   MI_FLUSH_DW_CCS              (1<<16)
-#define   MI_FLUSH_DW_OP_STOREDW       (1<<14)
-#define   MI_FLUSH_DW_USE_GTT          (1<<2)
-#define   MI_FLUSH_LENGTH              GENMASK(5, 0)
-#define   MI_FLUSH_IMM_DW              REG_FIELD_PREP(MI_FLUSH_LENGTH, 2)
-#define   MI_FLUSH_IMM_QW              REG_FIELD_PREP(MI_FLUSH_LENGTH, 3)
-
-#define MI_BATCH_BUFFER_START          MI_INSTR(0x31, 1)
-
 #define XY_CTRL_SURF_COPY_BLT          ((2 << 29) | (0x48 << 22) | 3)
 #define   SRC_ACCESS_TYPE_SHIFT                21
 #define   DST_ACCESS_TYPE_SHIFT                20
 #define   PIPE_CONTROL_STALL_AT_SCOREBOARD             (1<<1)
 #define   PIPE_CONTROL_DEPTH_CACHE_FLUSH               (1<<0)
 
-#define MI_ARB_CHECK            MI_INSTR(0x05, 0)
-
 #endif
 
 
 #include "xe_bb.h"
 
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_gpu_commands.h"
 #include "xe_device.h"
 #include "xe_exec_queue_types.h"
 
 
 #include <drm/drm_managed.h>
 
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_engine_regs.h"
 #include "regs/xe_gpu_commands.h"
 #include "regs/xe_gt_regs.h"
 
 #include <drm/drm_managed.h>
 #include <drm/xe_drm.h>
 
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_gt_regs.h"
 #include "xe_assert.h"
 #include "xe_bb.h"
 
 
 #include "xe_lrc.h"
 
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_engine_regs.h"
 #include "regs/xe_gpu_commands.h"
 #include "regs/xe_gt_regs.h"
 
 #include <drm/xe_drm.h>
 
 #include "generated/xe_wa_oob.h"
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_gpu_commands.h"
 #include "tests/xe_test.h"
 #include "xe_assert.h"
 
 #include "xe_ring_ops.h"
 
 #include "generated/xe_wa_oob.h"
+#include "instructions/xe_mi_commands.h"
 #include "regs/xe_gpu_commands.h"
 #include "regs/xe_gt_regs.h"
 #include "regs/xe_lrc_layout.h"
 
 static int emit_bb_start(u64 batch_addr, u32 ppgtt_flag, u32 *dw, int i)
 {
-       dw[i++] = MI_BATCH_BUFFER_START | ppgtt_flag;
+       dw[i++] = MI_BATCH_BUFFER_START | ppgtt_flag | XE_INSTR_NUM_DW(3);
        dw[i++] = lower_32_bits(batch_addr);
        dw[i++] = upper_32_bits(batch_addr);