mm/memory/fault: add THP fault handling for zone device private pages

author Balbir Singh <balbirs@nvidia.com>

Mon, 8 Sep 2025 00:04:40 +0000 (10:04 +1000)

committer Andrew Morton <akpm@linux-foundation.org>

Fri, 12 Sep 2025 00:26:06 +0000 (17:26 -0700)
author Balbir Singh <balbirs@nvidia.com>
Mon, 8 Sep 2025 00:04:40 +0000 (10:04 +1000)
committer Andrew Morton <akpm@linux-foundation.org>
Fri, 12 Sep 2025 00:26:06 +0000 (17:26 -0700)
diff --git a/include/linux/huge_mm.h b/include/linux/huge_mm.h

index f327d62fc9852d3cf717e633ed9b39deecfa0f20..2d669be7f1c800b607eb2ff58cb1cd8ab3c84283 100644 (file)
--- a/include/linux/huge_mm.h
+++ b/include/linux/huge_mm.h
@@ -496,6 +496,8 @@ static inline bool folio_test_pmd_mappable(struct folio *folio)
  
  vm_fault_t do_huge_pmd_numa_page(struct vm_fault *vmf);
  
+vm_fault_t do_huge_pmd_device_private(struct vm_fault *vmf);
+
  extern struct folio *huge_zero_folio;
  extern unsigned long huge_zero_pfn;
  
@@ -671,6 +673,11 @@ static inline vm_fault_t do_huge_pmd_numa_page(struct vm_fault *vmf)
         return 0;
  }
  
+static inline vm_fault_t do_huge_pmd_device_private(struct vm_fault *vmf)
+{
+       return 0;
+}
+
  static inline bool is_huge_zero_folio(const struct folio *folio)
  {
         return false;
diff --git a/mm/huge_memory.c b/mm/huge_memory.c

index f059ff4ec70729413783d997d51fb405528af196..094447965171e27e6ee1cf1ba37c2a0b585c23c3 100644 (file)
--- a/mm/huge_memory.c
+++ b/mm/huge_memory.c
@@ -1287,6 +1287,42 @@ release:
  
  }
  
+vm_fault_t do_huge_pmd_device_private(struct vm_fault *vmf)
+{
+       struct vm_area_struct *vma = vmf->vma;
+       vm_fault_t ret = 0;
+       spinlock_t *ptl;
+       swp_entry_t swp_entry;
+       struct page *page;
+
+       if (vmf->flags & FAULT_FLAG_VMA_LOCK) {
+               vma_end_read(vma);
+               return VM_FAULT_RETRY;
+       }
+
+       ptl = pmd_lock(vma->vm_mm, vmf->pmd);
+       if (unlikely(!pmd_same(*vmf->pmd, vmf->orig_pmd))) {
+               spin_unlock(ptl);
+               return 0;
+       }
+
+       swp_entry = pmd_to_swp_entry(vmf->orig_pmd);
+       page = pfn_swap_entry_to_page(swp_entry);
+       vmf->page = page;
+       vmf->pte = NULL;
+       if (trylock_page(vmf->page)) {
+               get_page(page);
+               spin_unlock(ptl);
+               ret = page_pgmap(page)->ops->migrate_to_ram(vmf);
+               unlock_page(vmf->page);
+               put_page(page);
+       } else {
+               spin_unlock(ptl);
+       }
+
+       return ret;
+}
+
  /*
   * always: directly stall for all thp allocations
   * defer: wake kswapd and fail if not immediately available
diff --git a/mm/memory.c b/mm/memory.c

index 9ec83417affc4215f7dae80b3eef07142a8bddfe..3e0404bd57a02c702410b50cc826ab3d0c3d61c2 100644 (file)
--- a/mm/memory.c
+++ b/mm/memory.c
@@ -6303,8 +6303,10 @@ retry_pud:
                 vmf.orig_pmd = pmdp_get_lockless(vmf.pmd);
  
                 if (unlikely(is_swap_pmd(vmf.orig_pmd))) {
-                       VM_BUG_ON(thp_migration_supported() &&
-                                         !is_pmd_migration_entry(vmf.orig_pmd));
+                       if (is_device_private_entry(
+                                       pmd_to_swp_entry(vmf.orig_pmd)))
+                               return do_huge_pmd_device_private(&vmf);
+
                         if (is_pmd_migration_entry(vmf.orig_pmd))
                                 pmd_migration_entry_wait(mm, vmf.pmd);
                         return 0;
author	Balbir Singh <balbirs@nvidia.com>
	Mon, 8 Sep 2025 00:04:40 +0000 (10:04 +1000)
committer	Andrew Morton <akpm@linux-foundation.org>
	Fri, 12 Sep 2025 00:26:06 +0000 (17:26 -0700)
include/linux/huge_mm.h		patch \| blob \| history
mm/huge_memory.c		patch \| blob \| history
mm/memory.c		patch \| blob \| history