mm: memcg/slab: save obj_cgroup for non-root slab objects

author Roman Gushchin <guro@fb.com>

Fri, 7 Aug 2020 06:20:56 +0000 (23:20 -0700)

committer Linus Torvalds <torvalds@linux-foundation.org>

Fri, 7 Aug 2020 18:33:24 +0000 (11:33 -0700)
author Roman Gushchin <guro@fb.com>
Fri, 7 Aug 2020 06:20:56 +0000 (23:20 -0700)
committer Linus Torvalds <torvalds@linux-foundation.org>
Fri, 7 Aug 2020 18:33:24 +0000 (11:33 -0700)
diff --git a/include/linux/memcontrol.h b/include/linux/memcontrol.h

index f2f9d5d6b7d1a70870c28801d343b10271d29f21..b845e908e76e3c12b9bd54bb251a760e202815e1 100644 (file)
--- a/include/linux/memcontrol.h
+++ b/include/linux/memcontrol.h
@@ -1404,7 +1404,8 @@ static inline void memcg_set_shrinker_bit(struct mem_cgroup *memcg,
  }
  #endif
  
-struct kmem_cache *memcg_kmem_get_cache(struct kmem_cache *cachep);
+struct kmem_cache *memcg_kmem_get_cache(struct kmem_cache *cachep,
+                                       struct obj_cgroup **objcgp);
  void memcg_kmem_put_cache(struct kmem_cache *cachep);
  
  #ifdef CONFIG_MEMCG_KMEM
diff --git a/mm/memcontrol.c b/mm/memcontrol.c

index e6cd4c0d44d1681a188f37c47738dd6c6bd7bfbd..ab96a120e6308be99468d58b4fa7c639e7369255 100644 (file)
--- a/mm/memcontrol.c
+++ b/mm/memcontrol.c
@@ -2973,7 +2973,8 @@ static inline bool memcg_kmem_bypass(void)
   * done with it, memcg_kmem_put_cache() must be called to release the
   * reference.
   */
-struct kmem_cache *memcg_kmem_get_cache(struct kmem_cache *cachep)
+struct kmem_cache *memcg_kmem_get_cache(struct kmem_cache *cachep,
+                                       struct obj_cgroup **objcgp)
  {
         struct mem_cgroup *memcg;
         struct kmem_cache *memcg_cachep;
@@ -3029,8 +3030,17 @@ struct kmem_cache *memcg_kmem_get_cache(struct kmem_cache *cachep)
          */
         if (unlikely(!memcg_cachep))
                 memcg_schedule_kmem_cache_create(memcg, cachep);
-       else if (percpu_ref_tryget(&memcg_cachep->memcg_params.refcnt))
+       else if (percpu_ref_tryget(&memcg_cachep->memcg_params.refcnt)) {
+               struct obj_cgroup *objcg = rcu_dereference(memcg->objcg);
+
+               if (!objcg || !obj_cgroup_tryget(objcg)) {
+                       percpu_ref_put(&memcg_cachep->memcg_params.refcnt);
+                       goto out_unlock;
+               }
+
+               *objcgp = objcg;
                 cachep = memcg_cachep;
+       }
  out_unlock:
         rcu_read_unlock();
         return cachep;
diff --git a/mm/slab.c b/mm/slab.c

index fa31cbb76124ba873448b75861f949351a4413ba..1e90b67735aa5c8d7939333bc3c0a5b299aafb62 100644 (file)
--- a/mm/slab.c
+++ b/mm/slab.c
@@ -3228,9 +3228,10 @@ slab_alloc_node(struct kmem_cache *cachep, gfp_t flags, int nodeid,
         unsigned long save_flags;
         void *ptr;
         int slab_node = numa_mem_id();
+       struct obj_cgroup *objcg = NULL;
  
         flags &= gfp_allowed_mask;
-       cachep = slab_pre_alloc_hook(cachep, flags);
+       cachep = slab_pre_alloc_hook(cachep, &objcg, 1, flags);
         if (unlikely(!cachep))
                 return NULL;
  
@@ -3266,7 +3267,7 @@ slab_alloc_node(struct kmem_cache *cachep, gfp_t flags, int nodeid,
         if (unlikely(slab_want_init_on_alloc(flags, cachep)) && ptr)
                 memset(ptr, 0, cachep->object_size);
  
-       slab_post_alloc_hook(cachep, flags, 1, &ptr);
+       slab_post_alloc_hook(cachep, objcg, flags, 1, &ptr);
         return ptr;
  }
  
@@ -3307,9 +3308,10 @@ slab_alloc(struct kmem_cache *cachep, gfp_t flags, unsigned long caller)
  {
         unsigned long save_flags;
         void *objp;
+       struct obj_cgroup *objcg = NULL;
  
         flags &= gfp_allowed_mask;
-       cachep = slab_pre_alloc_hook(cachep, flags);
+       cachep = slab_pre_alloc_hook(cachep, &objcg, 1, flags);
         if (unlikely(!cachep))
                 return NULL;
  
@@ -3323,7 +3325,7 @@ slab_alloc(struct kmem_cache *cachep, gfp_t flags, unsigned long caller)
         if (unlikely(slab_want_init_on_alloc(flags, cachep)) && objp)
                 memset(objp, 0, cachep->object_size);
  
-       slab_post_alloc_hook(cachep, flags, 1, &objp);
+       slab_post_alloc_hook(cachep, objcg, flags, 1, &objp);
         return objp;
  }
  
@@ -3450,6 +3452,7 @@ void ___cache_free(struct kmem_cache *cachep, void *objp,
                 memset(objp, 0, cachep->object_size);
         kmemleak_free_recursive(objp, cachep->flags);
         objp = cache_free_debugcheck(cachep, objp, caller);
+       memcg_slab_free_hook(cachep, virt_to_head_page(objp), objp);
  
         /*
          * Skip calling cache_free_alien() when the platform is not numa.
@@ -3515,8 +3518,9 @@ int kmem_cache_alloc_bulk(struct kmem_cache *s, gfp_t flags, size_t size,
                           void **p)
  {
         size_t i;
+       struct obj_cgroup *objcg = NULL;
  
-       s = slab_pre_alloc_hook(s, flags);
+       s = slab_pre_alloc_hook(s, &objcg, size, flags);
         if (!s)
                 return 0;
  
@@ -3539,13 +3543,13 @@ int kmem_cache_alloc_bulk(struct kmem_cache *s, gfp_t flags, size_t size,
                 for (i = 0; i < size; i++)
                         memset(p[i], 0, s->object_size);
  
-       slab_post_alloc_hook(s, flags, size, p);
+       slab_post_alloc_hook(s, objcg, flags, size, p);
         /* FIXME: Trace call missing. Christoph would like a bulk variant */
         return size;
  error:
         local_irq_enable();
         cache_alloc_debugcheck_after_bulk(s, flags, i, p, _RET_IP_);
-       slab_post_alloc_hook(s, flags, i, p);
+       slab_post_alloc_hook(s, objcg, flags, i, p);
         __kmem_cache_free_bulk(s, i, p);
         return 0;
  }
diff --git a/mm/slab.h b/mm/slab.h

index 9f78e3167f195d356a77b7f1f1ef5b86290894bc..d4f9fc93546f8e01d2a75d09e73252254381aaf7 100644 (file)
--- a/mm/slab.h
+++ b/mm/slab.h
@@ -470,6 +470,41 @@ static inline void memcg_free_page_obj_cgroups(struct page *page)
         page->obj_cgroups = NULL;
  }
  
+static inline void memcg_slab_post_alloc_hook(struct kmem_cache *s,
+                                             struct obj_cgroup *objcg,
+                                             size_t size, void **p)
+{
+       struct page *page;
+       unsigned long off;
+       size_t i;
+
+       for (i = 0; i < size; i++) {
+               if (likely(p[i])) {
+                       page = virt_to_head_page(p[i]);
+                       off = obj_to_index(s, page, p[i]);
+                       obj_cgroup_get(objcg);
+                       page_obj_cgroups(page)[off] = objcg;
+               }
+       }
+       obj_cgroup_put(objcg);
+       memcg_kmem_put_cache(s);
+}
+
+static inline void memcg_slab_free_hook(struct kmem_cache *s, struct page *page,
+                                       void *p)
+{
+       struct obj_cgroup *objcg;
+       unsigned int off;
+
+       if (!memcg_kmem_enabled() || is_root_cache(s))
+               return;
+
+       off = obj_to_index(s, page, p);
+       objcg = page_obj_cgroups(page)[off];
+       page_obj_cgroups(page)[off] = NULL;
+       obj_cgroup_put(objcg);
+}
+
  extern void slab_init_memcg_params(struct kmem_cache *);
  extern void memcg_link_cache(struct kmem_cache *s, struct mem_cgroup *memcg);
  
@@ -529,6 +564,17 @@ static inline void memcg_free_page_obj_cgroups(struct page *page)
  {
  }
  
+static inline void memcg_slab_post_alloc_hook(struct kmem_cache *s,
+                                             struct obj_cgroup *objcg,
+                                             size_t size, void **p)
+{
+}
+
+static inline void memcg_slab_free_hook(struct kmem_cache *s, struct page *page,
+                                       void *p)
+{
+}
+
  static inline void slab_init_memcg_params(struct kmem_cache *s)
  {
  }
@@ -631,7 +677,8 @@ static inline size_t slab_ksize(const struct kmem_cache *s)
  }
  
  static inline struct kmem_cache *slab_pre_alloc_hook(struct kmem_cache *s,
-                                                    gfp_t flags)
+                                                    struct obj_cgroup **objcgp,
+                                                    size_t size, gfp_t flags)
  {
         flags &= gfp_allowed_mask;
  
@@ -645,13 +692,14 @@ static inline struct kmem_cache *slab_pre_alloc_hook(struct kmem_cache *s,
  
         if (memcg_kmem_enabled() &&
             ((flags & __GFP_ACCOUNT) || (s->flags & SLAB_ACCOUNT)))
-               return memcg_kmem_get_cache(s);
+               return memcg_kmem_get_cache(s, objcgp);
  
         return s;
  }
  
-static inline void slab_post_alloc_hook(struct kmem_cache *s, gfp_t flags,
-                                       size_t size, void **p)
+static inline void slab_post_alloc_hook(struct kmem_cache *s,
+                                       struct obj_cgroup *objcg,
+                                       gfp_t flags, size_t size, void **p)
  {
         size_t i;
  
@@ -663,8 +711,8 @@ static inline void slab_post_alloc_hook(struct kmem_cache *s, gfp_t flags,
                                          s->flags, flags);
         }
  
-       if (memcg_kmem_enabled())
-               memcg_kmem_put_cache(s);
+       if (memcg_kmem_enabled() && !is_root_cache(s))
+               memcg_slab_post_alloc_hook(s, objcg, size, p);
  }
  
  #ifndef CONFIG_SLOB
diff --git a/mm/slub.c b/mm/slub.c

index 2a3075538f268b41a7a83461abfda34279693b0b..47e63b1100d4934df85d7abe94b01c6251770321 100644 (file)
--- a/mm/slub.c
+++ b/mm/slub.c
@@ -2817,8 +2817,9 @@ static __always_inline void *slab_alloc_node(struct kmem_cache *s,
         struct kmem_cache_cpu *c;
         struct page *page;
         unsigned long tid;
+       struct obj_cgroup *objcg = NULL;
  
-       s = slab_pre_alloc_hook(s, gfpflags);
+       s = slab_pre_alloc_hook(s, &objcg, 1, gfpflags);
         if (!s)
                 return NULL;
  redo:
@@ -2894,7 +2895,7 @@ redo:
         if (unlikely(slab_want_init_on_alloc(gfpflags, s)) && object)
                 memset(object, 0, s->object_size);
  
-       slab_post_alloc_hook(s, gfpflags, 1, &object);
+       slab_post_alloc_hook(s, objcg, gfpflags, 1, &object);
  
         return object;
  }
@@ -3099,6 +3100,8 @@ static __always_inline void do_slab_free(struct kmem_cache *s,
         void *tail_obj = tail ? : head;
         struct kmem_cache_cpu *c;
         unsigned long tid;
+
+       memcg_slab_free_hook(s, page, head);
  redo:
         /*
          * Determine the currently cpus per cpu slab.
@@ -3278,9 +3281,10 @@ int kmem_cache_alloc_bulk(struct kmem_cache *s, gfp_t flags, size_t size,
  {
         struct kmem_cache_cpu *c;
         int i;
+       struct obj_cgroup *objcg = NULL;
  
         /* memcg and kmem_cache debug support */
-       s = slab_pre_alloc_hook(s, flags);
+       s = slab_pre_alloc_hook(s, &objcg, size, flags);
         if (unlikely(!s))
                 return false;
         /*
@@ -3334,11 +3338,11 @@ int kmem_cache_alloc_bulk(struct kmem_cache *s, gfp_t flags, size_t size,
         }
  
         /* memcg and kmem_cache debug support */
-       slab_post_alloc_hook(s, flags, size, p);
+       slab_post_alloc_hook(s, objcg, flags, size, p);
         return i;
  error:
         local_irq_enable();
-       slab_post_alloc_hook(s, flags, i, p);
+       slab_post_alloc_hook(s, objcg, flags, i, p);
         __kmem_cache_free_bulk(s, i, p);
         return 0;
  }
author	Roman Gushchin <guro@fb.com>
	Fri, 7 Aug 2020 06:20:56 +0000 (23:20 -0700)
committer	Linus Torvalds <torvalds@linux-foundation.org>
	Fri, 7 Aug 2020 18:33:24 +0000 (11:33 -0700)
include/linux/memcontrol.h		patch \| blob \| history
mm/memcontrol.c		patch \| blob \| history
mm/slab.c		patch \| blob \| history
mm/slab.h		patch \| blob \| history
mm/slub.c		patch \| blob \| history