]> www.infradead.org Git - linux.git/commitdiff
xen: make multicall debug boot time selectable
authorJuergen Gross <jgross@suse.com>
Wed, 10 Jul 2024 09:27:49 +0000 (11:27 +0200)
committerJuergen Gross <jgross@suse.com>
Thu, 11 Jul 2024 14:33:39 +0000 (16:33 +0200)
Today Xen multicall debugging needs to be enabled via modifying a
define in a source file for getting debug data of multicall errors
encountered by users.

Switch multicall debugging to depend on a boot parameter "xen_mc_debug"
instead, enabling affected users to boot with the new parameter set in
order to get better diagnostics.

With debugging enabled print the following information in case at least
one of the batched calls failed:
- all calls of the batch with operation, result and caller
- all parameters of each call
- all parameters stored in the multicall data for each call

Signed-off-by: Juergen Gross <jgross@suse.com>
Reviewed-by: Boris Ostrovsky <boris.ostrovsky@oracle.com>
Message-ID: <20240710092749.13595-1-jgross@suse.com>
Signed-off-by: Juergen Gross <jgross@suse.com>
Documentation/admin-guide/kernel-parameters.txt
arch/x86/xen/multicalls.c

index 27ec49af1bf27b3bfa713067f4063a6e19046a71..b33d048e01d8e45951f7a19a0ee6213c7eeb3366 100644 (file)
                        Crash from Xen panic notifier, without executing late
                        panic() code such as dumping handler.
 
+       xen_mc_debug    [X86,XEN,EARLY]
+                       Enable multicall debugging when running as a Xen PV guest.
+                       Enabling this feature will reduce performance a little
+                       bit, so it should only be enabled for obtaining extended
+                       debug data in case of multicall errors.
+
        xen_msr_safe=   [X86,XEN,EARLY]
                        Format: <bool>
                        Select whether to always use non-faulting (safe) MSR
index 07054572297fcbedb4cb7999ef1750b720589d9c..a8d699687d5c0650c9867033eb864f4904488cdb 100644 (file)
@@ -23,6 +23,8 @@
 #include <linux/percpu.h>
 #include <linux/hardirq.h>
 #include <linux/debugfs.h>
+#include <linux/jump_label.h>
+#include <linux/printk.h>
 
 #include <asm/xen/hypercall.h>
 
 
 #define MC_BATCH       32
 
-#define MC_DEBUG       0
-
 #define MC_ARGS                (MC_BATCH * 16)
 
 
 struct mc_buffer {
        unsigned mcidx, argidx, cbidx;
        struct multicall_entry entries[MC_BATCH];
-#if MC_DEBUG
-       struct multicall_entry debug[MC_BATCH];
-       void *caller[MC_BATCH];
-#endif
        unsigned char args[MC_ARGS];
        struct callback {
                void (*fn)(void *);
@@ -50,13 +46,98 @@ struct mc_buffer {
        } callbacks[MC_BATCH];
 };
 
+struct mc_debug_data {
+       struct multicall_entry entries[MC_BATCH];
+       void *caller[MC_BATCH];
+       size_t argsz[MC_BATCH];
+       unsigned long *args[MC_BATCH];
+};
+
 static DEFINE_PER_CPU(struct mc_buffer, mc_buffer);
+static struct mc_debug_data mc_debug_data_early __initdata;
+static struct mc_debug_data __percpu *mc_debug_data __refdata =
+       &mc_debug_data_early;
 DEFINE_PER_CPU(unsigned long, xen_mc_irq_flags);
 
+static struct static_key mc_debug __ro_after_init;
+static bool mc_debug_enabled __initdata;
+
+static int __init xen_parse_mc_debug(char *arg)
+{
+       mc_debug_enabled = true;
+       static_key_slow_inc(&mc_debug);
+
+       return 0;
+}
+early_param("xen_mc_debug", xen_parse_mc_debug);
+
+static int __init mc_debug_enable(void)
+{
+       struct mc_debug_data __percpu *mcdb;
+       unsigned long flags;
+
+       if (!mc_debug_enabled)
+               return 0;
+
+       mcdb = alloc_percpu(struct mc_debug_data);
+       if (!mcdb) {
+               pr_err("xen_mc_debug inactive\n");
+               static_key_slow_dec(&mc_debug);
+               return -ENOMEM;
+       }
+
+       /* Be careful when switching to percpu debug data. */
+       local_irq_save(flags);
+       xen_mc_flush();
+       mc_debug_data = mcdb;
+       local_irq_restore(flags);
+
+       pr_info("xen_mc_debug active\n");
+
+       return 0;
+}
+early_initcall(mc_debug_enable);
+
+/* Number of parameters of hypercalls used via multicalls. */
+static const uint8_t hpcpars[] = {
+       [__HYPERVISOR_mmu_update] = 4,
+       [__HYPERVISOR_stack_switch] = 2,
+       [__HYPERVISOR_fpu_taskswitch] = 1,
+       [__HYPERVISOR_update_descriptor] = 2,
+       [__HYPERVISOR_update_va_mapping] = 3,
+       [__HYPERVISOR_mmuext_op] = 4,
+};
+
+static void print_debug_data(struct mc_buffer *b, struct mc_debug_data *mcdb,
+                            int idx)
+{
+       unsigned int arg;
+       unsigned int opidx = mcdb->entries[idx].op & 0xff;
+       unsigned int pars = 0;
+
+       pr_err("  call %2d: op=%lu result=%ld caller=%pS ", idx + 1,
+              mcdb->entries[idx].op, b->entries[idx].result,
+              mcdb->caller[idx]);
+       if (opidx < ARRAY_SIZE(hpcpars))
+               pars = hpcpars[opidx];
+       if (pars) {
+               pr_cont("pars=");
+               for (arg = 0; arg < pars; arg++)
+                       pr_cont("%lx ", mcdb->entries[idx].args[arg]);
+       }
+       if (mcdb->argsz[idx]) {
+               pr_cont("args=");
+               for (arg = 0; arg < mcdb->argsz[idx] / 8; arg++)
+                       pr_cont("%lx ", mcdb->args[idx][arg]);
+       }
+       pr_cont("\n");
+}
+
 void xen_mc_flush(void)
 {
        struct mc_buffer *b = this_cpu_ptr(&mc_buffer);
        struct multicall_entry *mc;
+       struct mc_debug_data *mcdb = NULL;
        int ret = 0;
        unsigned long flags;
        int i;
@@ -69,10 +150,11 @@ void xen_mc_flush(void)
 
        trace_xen_mc_flush(b->mcidx, b->argidx, b->cbidx);
 
-#if MC_DEBUG
-       memcpy(b->debug, b->entries,
-              b->mcidx * sizeof(struct multicall_entry));
-#endif
+       if (static_key_false(&mc_debug)) {
+               mcdb = this_cpu_ptr(mc_debug_data);
+               memcpy(mcdb->entries, b->entries,
+                      b->mcidx * sizeof(struct multicall_entry));
+       }
 
        switch (b->mcidx) {
        case 0:
@@ -103,21 +185,14 @@ void xen_mc_flush(void)
                pr_err("%d of %d multicall(s) failed: cpu %d\n",
                       ret, b->mcidx, smp_processor_id());
                for (i = 0; i < b->mcidx; i++) {
-                       if (b->entries[i].result < 0) {
-#if MC_DEBUG
-                               pr_err("  call %2d: op=%lu arg=[%lx] result=%ld\t%pS\n",
-                                      i + 1,
-                                      b->debug[i].op,
-                                      b->debug[i].args[0],
-                                      b->entries[i].result,
-                                      b->caller[i]);
-#else
+                       if (static_key_false(&mc_debug)) {
+                               print_debug_data(b, mcdb, i);
+                       } else if (b->entries[i].result < 0) {
                                pr_err("  call %2d: op=%lu arg=[%lx] result=%ld\n",
                                       i + 1,
                                       b->entries[i].op,
                                       b->entries[i].args[0],
                                       b->entries[i].result);
-#endif
                        }
                }
        }
@@ -155,9 +230,13 @@ struct multicall_space __xen_mc_entry(size_t args)
        }
 
        ret.mc = &b->entries[b->mcidx];
-#if MC_DEBUG
-       b->caller[b->mcidx] = __builtin_return_address(0);
-#endif
+       if (static_key_false(&mc_debug)) {
+               struct mc_debug_data *mcdb = this_cpu_ptr(mc_debug_data);
+
+               mcdb->caller[b->mcidx] = __builtin_return_address(0);
+               mcdb->argsz[b->mcidx] = args;
+               mcdb->args[b->mcidx] = (unsigned long *)(&b->args[argidx]);
+       }
        b->mcidx++;
        ret.args = &b->args[argidx];
        b->argidx = argidx + args;