]> www.infradead.org Git - users/hch/dma-mapping.git/commitdiff
powerpc/perf: Expose Performance Monitor Counter SPR's as part of extended regs
authorAthira Rajeev <atrajeev@linux.vnet.ibm.com>
Wed, 3 Feb 2021 06:55:36 +0000 (01:55 -0500)
committerMichael Ellerman <mpe@ellerman.id.au>
Mon, 8 Feb 2021 14:09:44 +0000 (01:09 +1100)
Currently Monitor Mode Control Registers and Sampling registers are
part of extended regs. Patch adds support to include Performance Monitor
Counter Registers (PMC1 to PMC6 ) as part of extended registers.

PMCs are saved in the perf interrupt handler as part of
per-cpu array 'pmcs' in struct cpu_hw_events. While capturing
the register values for extended regs, fetch these saved PMC values.

Simplified the PERF_REG_PMU_MASK_300/31 definition to include PMU
SPRs MMCR0 to PMC6. Exclude the unsupported SPRs (MMCR3, SIER2, SIER3)
from extended mask value for CPU_FTR_ARCH_300 in the new definition.

PERF_REG_EXTENDED_MAX is used to check if any index beyond the extended
registers is requested in the sample. Have one PERF_REG_EXTENDED_MAX
for CPU_FTR_ARCH_300/CPU_FTR_ARCH_31 since perf_reg_validate function
already checks the extended mask for the presence of any unsupported
register.

Signed-off-by: Athira Rajeev <atrajeev@linux.vnet.ibm.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
Link: https://lore.kernel.org/r/1612335337-1888-3-git-send-email-atrajeev@linux.vnet.ibm.com
arch/powerpc/include/asm/perf_event.h
arch/powerpc/include/uapi/asm/perf_regs.h
arch/powerpc/perf/core-book3s.c
arch/powerpc/perf/perf_regs.c

index daec64d41b44781576f7369601fb551622912386..164e910bf654f3d6e4e13ad27a46c2450f0ae10b 100644 (file)
@@ -14,6 +14,7 @@
 #include <asm/perf_event_server.h>
 #else
 static inline bool is_sier_available(void) { return false; }
+static inline unsigned long get_pmcs_ext_regs(int idx) { return 0; }
 #endif
 
 #ifdef CONFIG_FSL_EMB_PERF_EVENT
@@ -40,6 +41,7 @@ static inline bool is_sier_available(void) { return false; }
 
 /* To support perf_regs sier update */
 extern bool is_sier_available(void);
+extern unsigned long get_pmcs_ext_regs(int idx);
 /* To define perf extended regs mask value */
 extern u64 PERF_REG_EXTENDED_MASK;
 #define PERF_REG_EXTENDED_MASK PERF_REG_EXTENDED_MASK
index bdf5f10f8b9f50c58e7fa618e1ab64f7beb6e095..578b3ee86105d26ae731e9a177223b74cdbd2cd3 100644 (file)
@@ -55,17 +55,33 @@ enum perf_event_powerpc_regs {
        PERF_REG_POWERPC_MMCR3,
        PERF_REG_POWERPC_SIER2,
        PERF_REG_POWERPC_SIER3,
+       PERF_REG_POWERPC_PMC1,
+       PERF_REG_POWERPC_PMC2,
+       PERF_REG_POWERPC_PMC3,
+       PERF_REG_POWERPC_PMC4,
+       PERF_REG_POWERPC_PMC5,
+       PERF_REG_POWERPC_PMC6,
        /* Max regs without the extended regs */
        PERF_REG_POWERPC_MAX = PERF_REG_POWERPC_MMCRA + 1,
 };
 
 #define PERF_REG_PMU_MASK      ((1ULL << PERF_REG_POWERPC_MAX) - 1)
 
-/* PERF_REG_EXTENDED_MASK value for CPU_FTR_ARCH_300 */
-#define PERF_REG_PMU_MASK_300   (((1ULL << (PERF_REG_POWERPC_MMCR2 + 1)) - 1) - PERF_REG_PMU_MASK)
-/* PERF_REG_EXTENDED_MASK value for CPU_FTR_ARCH_31 */
-#define PERF_REG_PMU_MASK_31   (((1ULL << (PERF_REG_POWERPC_SIER3 + 1)) - 1) - PERF_REG_PMU_MASK)
+/* Exclude MMCR3, SIER2, SIER3 for CPU_FTR_ARCH_300 */
+#define        PERF_EXCLUDE_REG_EXT_300        (7ULL << PERF_REG_POWERPC_MMCR3)
 
-#define PERF_REG_MAX_ISA_300   (PERF_REG_POWERPC_MMCR2 + 1)
-#define PERF_REG_MAX_ISA_31    (PERF_REG_POWERPC_SIER3 + 1)
+/*
+ * PERF_REG_EXTENDED_MASK value for CPU_FTR_ARCH_300
+ * includes 9 SPRS from MMCR0 to PMC6 excluding the
+ * unsupported SPRS in PERF_EXCLUDE_REG_EXT_300.
+ */
+#define PERF_REG_PMU_MASK_300   ((0xfffULL << PERF_REG_POWERPC_MMCR0) - PERF_EXCLUDE_REG_EXT_300)
+
+/*
+ * PERF_REG_EXTENDED_MASK value for CPU_FTR_ARCH_31
+ * includes 12 SPRs from MMCR0 to PMC6.
+ */
+#define PERF_REG_PMU_MASK_31   (0xfffULL << PERF_REG_POWERPC_MMCR0)
+
+#define PERF_REG_EXTENDED_MAX  (PERF_REG_POWERPC_PMC6 + 1)
 #endif /* _UAPI_ASM_POWERPC_PERF_REGS_H */
index 72bedd812b6052f8b42fb4b59621912cb24b05e2..278974f3264d778a48c9efc6cdb74dc0abfdbf9b 100644 (file)
@@ -146,6 +146,17 @@ bool is_sier_available(void)
        return false;
 }
 
+/*
+ * Return PMC value corresponding to the
+ * index passed.
+ */
+unsigned long get_pmcs_ext_regs(int idx)
+{
+       struct cpu_hw_events *cpuhw = this_cpu_ptr(&cpu_hw_events);
+
+       return cpuhw->pmcs[idx];
+}
+
 static bool regs_use_siar(struct pt_regs *regs)
 {
        /*
index 6f681b105eec21bb1d0375f136aaea0e6a71da1a..b931eed482c9341ac1cf6c8272b37b85698f9cd9 100644 (file)
@@ -75,6 +75,8 @@ static unsigned int pt_regs_offset[PERF_REG_POWERPC_MAX] = {
 static u64 get_ext_regs_value(int idx)
 {
        switch (idx) {
+       case PERF_REG_POWERPC_PMC1 ... PERF_REG_POWERPC_PMC6:
+               return get_pmcs_ext_regs(idx - PERF_REG_POWERPC_PMC1);
        case PERF_REG_POWERPC_MMCR0:
                return mfspr(SPRN_MMCR0);
        case PERF_REG_POWERPC_MMCR1:
@@ -95,13 +97,6 @@ static u64 get_ext_regs_value(int idx)
 
 u64 perf_reg_value(struct pt_regs *regs, int idx)
 {
-       u64 perf_reg_extended_max = PERF_REG_POWERPC_MAX;
-
-       if (cpu_has_feature(CPU_FTR_ARCH_31))
-               perf_reg_extended_max = PERF_REG_MAX_ISA_31;
-       else if (cpu_has_feature(CPU_FTR_ARCH_300))
-               perf_reg_extended_max = PERF_REG_MAX_ISA_300;
-
        if (idx == PERF_REG_POWERPC_SIER &&
           (IS_ENABLED(CONFIG_FSL_EMB_PERF_EVENT) ||
            IS_ENABLED(CONFIG_PPC32) ||
@@ -113,14 +108,14 @@ u64 perf_reg_value(struct pt_regs *regs, int idx)
            IS_ENABLED(CONFIG_PPC32)))
                return 0;
 
-       if (idx >= PERF_REG_POWERPC_MAX && idx < perf_reg_extended_max)
+       if (idx >= PERF_REG_POWERPC_MAX && idx < PERF_REG_EXTENDED_MAX)
                return get_ext_regs_value(idx);
 
        /*
         * If the idx is referring to value beyond the
         * supported registers, return 0 with a warning
         */
-       if (WARN_ON_ONCE(idx >= perf_reg_extended_max))
+       if (WARN_ON_ONCE(idx >= PERF_REG_EXTENDED_MAX))
                return 0;
 
        return regs_get_register(regs, pt_regs_offset[idx]);