I noticed CPU pipeline stalls while using perf.
Once an svc thread is scheduled and executing an RPC, no other
processes will touch svc_rqst::rq_flags. Thus bus-locked atomics are
not needed outside the svc thread scheduler.
Signed-off-by: Chuck Lever <chuck.lever@oracle.com>
         * the client wants us to do more in this compound:
         */
        if (!nfsd4_last_compound_op(rqstp))
-               clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
+               __clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
 
        /* check stateid */
        status = nfs4_preprocess_stateid_op(rqstp, cstate, &cstate->current_fh,
        cstate->minorversion = args->minorversion;
        fh_init(current_fh, NFS4_FHSIZE);
        fh_init(save_fh, NFS4_FHSIZE);
+
        /*
         * Don't use the deferral mechanism for NFSv4; compounds make it
         * too hard to avoid non-idempotency problems.
         */
-       clear_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
+       __clear_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
 
        /*
         * According to RFC3010, this takes precedence over all other errors.
 out:
        cstate->status = status;
        /* Reset deferral mechanism for RPC deferrals */
-       set_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
+       __set_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
        return rpc_success;
 }
 
 
        argp->rqstp->rq_cachetype = cachethis ? RC_REPLBUFF : RC_NOCACHE;
 
        if (readcount > 1 || max_reply > PAGE_SIZE - auth_slack)
-               clear_bit(RQ_SPLICE_OK, &argp->rqstp->rq_flags);
+               __clear_bit(RQ_SPLICE_OK, &argp->rqstp->rq_flags);
 
        return true;
 }
 
         * rejecting the server-computed MIC in this somewhat rare case,
         * do not use splice with the GSS integrity service.
         */
-       clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
+       __clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
 
        /* Did we already verify the signature on the original pass through? */
        if (rqstp->rq_deferred)
        int pad, remaining_len, offset;
        u32 rseqno;
 
-       clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
+       __clear_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
 
        priv_len = svc_getnl(&buf->head[0]);
        if (rqstp->rq_deferred) {
 
                goto err_short_len;
 
        /* Will be turned off by GSS integrity and privacy services */
-       set_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
+       __set_bit(RQ_SPLICE_OK, &rqstp->rq_flags);
        /* Will be turned off only when NFSv4 Sessions are used */
-       set_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
-       clear_bit(RQ_DROPME, &rqstp->rq_flags);
+       __set_bit(RQ_USEDEFERRAL, &rqstp->rq_flags);
+       __clear_bit(RQ_DROPME, &rqstp->rq_flags);
 
        svc_putu32(resv, rqstp->rq_xid);
 
 
        trace_svc_defer(rqstp);
        svc_xprt_get(rqstp->rq_xprt);
        dr->xprt = rqstp->rq_xprt;
-       set_bit(RQ_DROPME, &rqstp->rq_flags);
+       __set_bit(RQ_DROPME, &rqstp->rq_flags);
 
        dr->handle.revisit = svc_revisit;
        return &dr->handle;
 
 static void svc_sock_secure_port(struct svc_rqst *rqstp)
 {
        if (svc_port_is_privileged(svc_addr(rqstp)))
-               set_bit(RQ_SECURE, &rqstp->rq_flags);
+               __set_bit(RQ_SECURE, &rqstp->rq_flags);
        else
-               clear_bit(RQ_SECURE, &rqstp->rq_flags);
+               __clear_bit(RQ_SECURE, &rqstp->rq_flags);
 }
 
 /*
        rqstp->rq_xprt_ctxt   = NULL;
        rqstp->rq_prot        = IPPROTO_TCP;
        if (test_bit(XPT_LOCAL, &svsk->sk_xprt.xpt_flags))
-               set_bit(RQ_LOCAL, &rqstp->rq_flags);
+               __set_bit(RQ_LOCAL, &rqstp->rq_flags);
        else
-               clear_bit(RQ_LOCAL, &rqstp->rq_flags);
+               __clear_bit(RQ_LOCAL, &rqstp->rq_flags);
 
        p = (__be32 *)rqstp->rq_arg.head[0].iov_base;
        calldir = p[1];
 
 
 static void svc_rdma_secure_port(struct svc_rqst *rqstp)
 {
-       set_bit(RQ_SECURE, &rqstp->rq_flags);
+       __set_bit(RQ_SECURE, &rqstp->rq_flags);
 }
 
 static void svc_rdma_kill_temp_xprt(struct svc_xprt *xprt)