/* With PTI, we unconditionally serialize before running user code. */
        if (static_cpu_has(X86_FEATURE_PTI))
                return;
+
        /*
-        * Return from interrupt and NMI is done through iret, which is core
-        * serializing.
+        * Even if we're in an interrupt, we might reschedule before returning,
+        * in which case we could switch to a different thread in the same mm
+        * and return using SYSRET or SYSEXIT.  Instead of trying to keep
+        * track of our need to sync the core, just sync right away.
         */
-       if (in_irq() || in_nmi())
-               return;
        sync_core();
 }
 
 
        /*
         * The membarrier system call requires a full memory barrier and
         * core serialization before returning to user-space, after
-        * storing to rq->curr. Writing to CR3 provides that full
-        * memory barrier and core serializing instruction.
+        * storing to rq->curr, when changing mm.  This is because
+        * membarrier() sends IPIs to all CPUs that are in the target mm
+        * to make them issue memory barriers.  However, if another CPU
+        * switches to/from the target mm concurrently with
+        * membarrier(), it can cause that CPU not to receive an IPI
+        * when it really should issue a memory barrier.  Writing to CR3
+        * provides that full memory barrier and core serializing
+        * instruction.
         */
        if (real_prev == next) {
                VM_WARN_ON(this_cpu_read(cpu_tlbstate.ctxs[prev_asid].ctx_id) !=