To test and profile the overhead of io_uring task_work and the various
types of it, add IORING_NOP_TW which tells nop to signal completions
through task_work rather than complete them inline.
Signed-off-by: Jens Axboe <axboe@kernel.dk>
 #define IORING_NOP_FILE                        (1U << 1)
 #define IORING_NOP_FIXED_FILE          (1U << 2)
 #define IORING_NOP_FIXED_BUFFER                (1U << 3)
+#define IORING_NOP_TW                  (1U << 4)
 
 /*
  * IO completion data structure (Completion Queue Entry)
 
 };
 
 #define NOP_FLAGS      (IORING_NOP_INJECT_RESULT | IORING_NOP_FIXED_FILE | \
-                        IORING_NOP_FIXED_BUFFER | IORING_NOP_FILE)
+                        IORING_NOP_FIXED_BUFFER | IORING_NOP_FILE | \
+                        IORING_NOP_TW)
 
 int io_nop_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)
 {
        if (ret < 0)
                req_set_fail(req);
        io_req_set_res(req, nop->result, 0);
+       if (nop->flags & IORING_NOP_TW) {
+               req->io_task_work.func = io_req_task_complete;
+               io_req_task_work_add(req);
+               return IOU_ISSUE_SKIP_COMPLETE;
+       }
        return IOU_COMPLETE;
 }