]> www.infradead.org Git - users/hch/dma-mapping.git/commitdiff
net/sched: act_api: rely on rcu in tcf_idr_check_alloc
authorPedro Tammela <pctammela@mojatatu.com>
Mon, 11 Dec 2023 18:18:06 +0000 (15:18 -0300)
committerJakub Kicinski <kuba@kernel.org>
Thu, 14 Dec 2023 01:53:59 +0000 (17:53 -0800)
Instead of relying only on the idrinfo->lock mutex for
bind/alloc logic, rely on a combination of rcu + mutex + atomics
to better scale the case where multiple rtnl-less filters are
binding to the same action object.

Action binding happens when an action index is specified explicitly and
an action exists which such index exists. Example:
  tc actions add action drop index 1
  tc filter add ... matchall action drop index 1
  tc filter add ... matchall action drop index 1
  tc filter add ... matchall action drop index 1
  tc filter ls ...
     filter protocol all pref 49150 matchall chain 0 filter protocol all pref 49150 matchall chain 0 handle 0x1
     not_in_hw
           action order 1: gact action drop
            random type none pass val 0
            index 1 ref 4 bind 3

   filter protocol all pref 49151 matchall chain 0 filter protocol all pref 49151 matchall chain 0 handle 0x1
     not_in_hw
           action order 1: gact action drop
            random type none pass val 0
            index 1 ref 4 bind 3

   filter protocol all pref 49152 matchall chain 0 filter protocol all pref 49152 matchall chain 0 handle 0x1
     not_in_hw
           action order 1: gact action drop
            random type none pass val 0
            index 1 ref 4 bind 3

When no index is specified, as before, grab the mutex and allocate
in the idr the next available id. In this version, as opposed to before,
it's simplified to store the -EBUSY pointer instead of the previous
alloc + replace combination.

When an index is specified, rely on rcu to find if there's an object in
such index. If there's none, fallback to the above, serializing on the
mutex and reserving the specified id. If there's one, it can be an -EBUSY
pointer, in which case we just try again until it's an action, or an action.
Given the rcu guarantees, the action found could be dead and therefore
we need to bump the refcount if it's not 0, handling the case it's
in fact 0.

As bind and the action refcount are already atomics, these increments can
happen without the mutex protection while many tcf_idr_check_alloc race
to bind to the same action instance.

In case binding encounters a parallel delete or add, it will return
-EAGAIN in order to try again. Both filter and action apis already
have the retry machinery in-place. In case it's an unlocked filter it
retries under the rtnl lock.

Signed-off-by: Pedro Tammela <pctammela@mojatatu.com>
Acked-by: Jamal Hadi Salim <jhs@mojatatu.com>
Reviewed-by: Vlad Buslov <vladbu@nvidia.com>
Link: https://lore.kernel.org/r/20231211181807.96028-2-pctammela@mojatatu.com
Signed-off-by: Jakub Kicinski <kuba@kernel.org>
net/sched/act_api.c

index 6611f292b6cb71b3faed87a39f041cd15dc6e166..076d5cdde656ab7f3017f5fa86da3ce68471272e 100644 (file)
@@ -816,6 +816,9 @@ EXPORT_SYMBOL(tcf_idr_cleanup);
  * its reference and bind counters, and return 1. Otherwise insert temporary
  * error pointer (to prevent concurrent users from inserting actions with same
  * index) and return 0.
+ *
+ * May return -EAGAIN for binding actions in case of a parallel add/delete on
+ * the requested index.
  */
 
 int tcf_idr_check_alloc(struct tc_action_net *tn, u32 *index,
@@ -824,43 +827,61 @@ int tcf_idr_check_alloc(struct tc_action_net *tn, u32 *index,
        struct tcf_idrinfo *idrinfo = tn->idrinfo;
        struct tc_action *p;
        int ret;
+       u32 max;
 
-again:
-       mutex_lock(&idrinfo->lock);
        if (*index) {
+again:
+               rcu_read_lock();
                p = idr_find(&idrinfo->action_idr, *index);
+
                if (IS_ERR(p)) {
                        /* This means that another process allocated
                         * index but did not assign the pointer yet.
                         */
-                       mutex_unlock(&idrinfo->lock);
+                       rcu_read_unlock();
                        goto again;
                }
 
-               if (p) {
-                       refcount_inc(&p->tcfa_refcnt);
-                       if (bind)
-                               atomic_inc(&p->tcfa_bindcnt);
-                       *a = p;
-                       ret = 1;
-               } else {
-                       *a = NULL;
-                       ret = idr_alloc_u32(&idrinfo->action_idr, NULL, index,
-                                           *index, GFP_KERNEL);
-                       if (!ret)
-                               idr_replace(&idrinfo->action_idr,
-                                           ERR_PTR(-EBUSY), *index);
+               if (!p) {
+                       /* Empty slot, try to allocate it */
+                       max = *index;
+                       rcu_read_unlock();
+                       goto new;
+               }
+
+               if (!refcount_inc_not_zero(&p->tcfa_refcnt)) {
+                       /* Action was deleted in parallel */
+                       rcu_read_unlock();
+                       return -EAGAIN;
                }
+
+               if (bind)
+                       atomic_inc(&p->tcfa_bindcnt);
+               *a = p;
+
+               rcu_read_unlock();
+
+               return 1;
        } else {
+               /* Find a slot */
                *index = 1;
-               *a = NULL;
-               ret = idr_alloc_u32(&idrinfo->action_idr, NULL, index,
-                                   UINT_MAX, GFP_KERNEL);
-               if (!ret)
-                       idr_replace(&idrinfo->action_idr, ERR_PTR(-EBUSY),
-                                   *index);
+               max = UINT_MAX;
        }
+
+new:
+       *a = NULL;
+
+       mutex_lock(&idrinfo->lock);
+       ret = idr_alloc_u32(&idrinfo->action_idr, ERR_PTR(-EBUSY), index, max,
+                           GFP_KERNEL);
        mutex_unlock(&idrinfo->lock);
+
+       /* N binds raced for action allocation,
+        * retry for all the ones that failed.
+        */
+       if (ret == -ENOSPC && *index == max)
+               ret = -EAGAIN;
+
        return ret;
 }
 EXPORT_SYMBOL(tcf_idr_check_alloc);