cxl/pci: Support Global Persistent Flush (GPF)

author Davidlohr Bueso <dave@stgolabs.net>

Fri, 24 Jan 2025 23:35:33 +0000 (15:35 -0800)

committer Dave Jiang <dave.jiang@intel.com>

Fri, 14 Mar 2025 22:50:22 +0000 (15:50 -0700)
author Davidlohr Bueso <dave@stgolabs.net>
Fri, 24 Jan 2025 23:35:33 +0000 (15:35 -0800)
committer Dave Jiang <dave.jiang@intel.com>
Fri, 14 Mar 2025 22:50:22 +0000 (15:50 -0700)
diff --git a/Documentation/driver-api/cxl/maturity-map.rst b/Documentation/driver-api/cxl/maturity-map.rst

index df8e2ac2a320c9047244854c8817905d5adab405..99dd2c841e69dfea98e70a374caf0fdc65ee8079 100644 (file)
--- a/Documentation/driver-api/cxl/maturity-map.rst
+++ b/Documentation/driver-api/cxl/maturity-map.rst
@@ -130,7 +130,7 @@ Mailbox commands
  * [0] Switch CCI
  * [3] Timestamp
  * [1] PMEM labels
-* [0] PMEM GPF / Dirty Shutdown
+* [1] PMEM GPF / Dirty Shutdown
  * [0] Scan Media
  
  PMU
diff --git a/drivers/cxl/core/core.h b/drivers/cxl/core/core.h

index 800466f96a68517f0c6930faa555b347cf0e156b..8f2eb76a3c8c745b5f750d24ddf422d9e6cee34a 100644 (file)
--- a/drivers/cxl/core/core.h
+++ b/drivers/cxl/core/core.h
@@ -115,4 +115,6 @@ bool cxl_need_node_perf_attrs_update(int nid);
  int cxl_port_get_switch_dport_bandwidth(struct cxl_port *port,
                                         struct access_coordinate *c);
  
+int cxl_gpf_port_setup(struct device *dport_dev, struct cxl_port *port);
+
  #endif /* __CXL_CORE_H__ */
diff --git a/drivers/cxl/core/mbox.c b/drivers/cxl/core/mbox.c

index 548564c770c02c0a4571a00ae3f6de8f63183183..5b89ae5c5e28075364accf15ba5d0798281398fd 100644 (file)
--- a/drivers/cxl/core/mbox.c
+++ b/drivers/cxl/core/mbox.c
@@ -1308,6 +1308,24 @@ int cxl_mem_create_range_info(struct cxl_memdev_state *mds)
  }
  EXPORT_SYMBOL_NS_GPL(cxl_mem_create_range_info, "CXL");
  
+int cxl_dirty_shutdown_state(struct cxl_memdev_state *mds)
+{
+       struct cxl_mailbox *cxl_mbox = &mds->cxlds.cxl_mbox;
+       struct cxl_mbox_cmd mbox_cmd;
+       struct cxl_mbox_set_shutdown_state_in in = {
+               .state = 1
+       };
+
+       mbox_cmd = (struct cxl_mbox_cmd) {
+               .opcode = CXL_MBOX_OP_SET_SHUTDOWN_STATE,
+               .size_in = sizeof(in),
+               .payload_in = &in,
+       };
+
+       return cxl_internal_send_cmd(cxl_mbox, &mbox_cmd);
+}
+EXPORT_SYMBOL_NS_GPL(cxl_dirty_shutdown_state, "CXL");
+
  int cxl_set_timestamp(struct cxl_memdev_state *mds)
  {
         struct cxl_mailbox *cxl_mbox = &mds->cxlds.cxl_mbox;
diff --git a/drivers/cxl/core/pci.c b/drivers/cxl/core/pci.c

index 013b869b66cbc98db596032e3450c8fa3574106a..a5c65f79db1898ba374450ced8f624d9b093ee02 100644 (file)
--- a/drivers/cxl/core/pci.c
+++ b/drivers/cxl/core/pci.c
@@ -1054,3 +1054,90 @@ int cxl_pci_get_bandwidth(struct pci_dev *pdev, struct access_coordinate *c)
  
         return 0;
  }
+
+/*
+ * Set max timeout such that platforms will optimize GPF flow to avoid
+ * the implied worst-case scenario delays. On a sane platform, all
+ * devices should always complete GPF within the energy budget of
+ * the GPF flow. The kernel does not have enough information to pick
+ * anything better than "maximize timeouts and hope it works".
+ *
+ * A misbehaving device could block forward progress of GPF for all
+ * the other devices, exhausting the energy budget of the platform.
+ * However, the spec seems to assume that moving on from slow to respond
+ * devices is a virtue. It is not possible to know that, in actuality,
+ * the slow to respond device is *the* most critical device in the
+ * system to wait.
+ */
+#define GPF_TIMEOUT_BASE_MAX 2
+#define GPF_TIMEOUT_SCALE_MAX 7 /* 10 seconds */
+
+static int update_gpf_port_dvsec(struct pci_dev *pdev, int dvsec, int phase)
+{
+       u64 base, scale;
+       int rc, offset;
+       u16 ctrl;
+
+       switch (phase) {
+       case 1:
+               offset = CXL_DVSEC_PORT_GPF_PHASE_1_CONTROL_OFFSET;
+               base = CXL_DVSEC_PORT_GPF_PHASE_1_TMO_BASE_MASK;
+               scale = CXL_DVSEC_PORT_GPF_PHASE_1_TMO_SCALE_MASK;
+               break;
+       case 2:
+               offset = CXL_DVSEC_PORT_GPF_PHASE_2_CONTROL_OFFSET;
+               base = CXL_DVSEC_PORT_GPF_PHASE_2_TMO_BASE_MASK;
+               scale = CXL_DVSEC_PORT_GPF_PHASE_2_TMO_SCALE_MASK;
+               break;
+       default:
+               return -EINVAL;
+       }
+
+       rc = pci_read_config_word(pdev, dvsec + offset, &ctrl);
+       if (rc)
+               return rc;
+
+       if (FIELD_GET(base, ctrl) == GPF_TIMEOUT_BASE_MAX &&
+           FIELD_GET(scale, ctrl) == GPF_TIMEOUT_SCALE_MAX)
+               return 0;
+
+       ctrl = FIELD_PREP(base, GPF_TIMEOUT_BASE_MAX);
+       ctrl |= FIELD_PREP(scale, GPF_TIMEOUT_SCALE_MAX);
+
+       rc = pci_write_config_word(pdev, dvsec + offset, ctrl);
+       if (!rc)
+               pci_dbg(pdev, "Port GPF phase %d timeout: %d0 secs\n",
+                       phase, GPF_TIMEOUT_BASE_MAX);
+
+       return rc;
+}
+
+int cxl_gpf_port_setup(struct device *dport_dev, struct cxl_port *port)
+{
+       struct pci_dev *pdev;
+
+       if (!dev_is_pci(dport_dev))
+               return 0;
+
+       pdev = to_pci_dev(dport_dev);
+       if (!pdev || !port)
+               return -EINVAL;
+
+       if (!port->gpf_dvsec) {
+               int dvsec;
+
+               dvsec = pci_find_dvsec_capability(pdev, PCI_VENDOR_ID_CXL,
+                                                 CXL_DVSEC_PORT_GPF);
+               if (!dvsec) {
+                       pci_warn(pdev, "Port GPF DVSEC not present\n");
+                       return -EINVAL;
+               }
+
+               port->gpf_dvsec = dvsec;
+       }
+
+       update_gpf_port_dvsec(pdev, port->gpf_dvsec, 1);
+       update_gpf_port_dvsec(pdev, port->gpf_dvsec, 2);
+
+       return 0;
+}
diff --git a/drivers/cxl/core/port.c b/drivers/cxl/core/port.c

index 78a5c2c259829c3e1a7671ff61fdd95c6c43cc82..95cd6f11bbfa5bb0a0eccaff2338bfaf058d9183 100644 (file)
--- a/drivers/cxl/core/port.c
+++ b/drivers/cxl/core/port.c
@@ -1672,6 +1672,8 @@ retry:
                         if (rc && rc != -EBUSY)
                                 return rc;
  
+                       cxl_gpf_port_setup(dport_dev, port);
+
                         /* Any more ports to add between this one and the root? */
                         if (!dev_is_cxl_root_child(&port->dev))
                                 continue;
diff --git a/drivers/cxl/cxl.h b/drivers/cxl/cxl.h

index bbbaa0d0a67036c997e5f970cb8741e67fbb644a..55af041df7b20caeac61bcc67c6b053647c87f0e 100644 (file)
--- a/drivers/cxl/cxl.h
+++ b/drivers/cxl/cxl.h
@@ -610,6 +610,7 @@ struct cxl_dax_region {
   * @cdat: Cached CDAT data
   * @cdat_available: Should a CDAT attribute be available in sysfs
   * @pci_latency: Upstream latency in picoseconds
+ * @gpf_dvsec: Cached GPF port DVSEC
   */
  struct cxl_port {
         struct device dev;
@@ -633,6 +634,7 @@ struct cxl_port {
         } cdat;
         bool cdat_available;
         long pci_latency;
+       int gpf_dvsec;
  };
  
  /**
diff --git a/drivers/cxl/cxlmem.h b/drivers/cxl/cxlmem.h

index 2a25d1957ddb9772b8d4dca92534ba76a909f8b3..5d49e0a93426751dcd13d099ed7341641342c22f 100644 (file)
--- a/drivers/cxl/cxlmem.h
+++ b/drivers/cxl/cxlmem.h
@@ -693,6 +693,11 @@ struct cxl_mbox_set_partition_info {
  
  #define  CXL_SET_PARTITION_IMMEDIATE_FLAG      BIT(0)
  
+/* Set Shutdown State Input Payload CXL 3.2 Spec 8.2.10.9.3.5 Table 8-152 */
+struct cxl_mbox_set_shutdown_state_in {
+       u8 state;
+} __packed;
+
  /* Set Timestamp CXL 3.0 Spec 8.2.9.4.2 */
  struct cxl_mbox_set_timestamp_in {
         __le64 timestamp;
@@ -829,6 +834,7 @@ void cxl_event_trace_record(const struct cxl_memdev *cxlmd,
                             enum cxl_event_log_type type,
                             enum cxl_event_type event_type,
                             const uuid_t *uuid, union cxl_event *evt);
+int cxl_dirty_shutdown_state(struct cxl_memdev_state *mds);
  int cxl_set_timestamp(struct cxl_memdev_state *mds);
  int cxl_poison_state_init(struct cxl_memdev_state *mds);
  int cxl_mem_get_poison(struct cxl_memdev *cxlmd, u64 offset, u64 len,
diff --git a/drivers/cxl/cxlpci.h b/drivers/cxl/cxlpci.h

index 4da07727ab9cd15beb0f1f917d42a91bca171fb9..54e219b0049eaa626f073feb2f368fa639272e9f 100644 (file)
--- a/drivers/cxl/cxlpci.h
+++ b/drivers/cxl/cxlpci.h
@@ -40,6 +40,12 @@
  
  /* CXL 2.0 8.1.6: GPF DVSEC for CXL Port */
  #define CXL_DVSEC_PORT_GPF                                     4
+#define   CXL_DVSEC_PORT_GPF_PHASE_1_CONTROL_OFFSET            0x0C
+#define     CXL_DVSEC_PORT_GPF_PHASE_1_TMO_BASE_MASK           GENMASK(3, 0)
+#define     CXL_DVSEC_PORT_GPF_PHASE_1_TMO_SCALE_MASK          GENMASK(11, 8)
+#define   CXL_DVSEC_PORT_GPF_PHASE_2_CONTROL_OFFSET            0xE
+#define     CXL_DVSEC_PORT_GPF_PHASE_2_TMO_BASE_MASK           GENMASK(3, 0)
+#define     CXL_DVSEC_PORT_GPF_PHASE_2_TMO_SCALE_MASK          GENMASK(11, 8)
  
  /* CXL 2.0 8.1.7: GPF DVSEC for CXL Device */
  #define CXL_DVSEC_DEVICE_GPF                                   5
diff --git a/drivers/cxl/pmem.c b/drivers/cxl/pmem.c

index f9c95996e937ed495e2fd9ac8547c9e3102ad7cc..a39e2c52d7ab5b9000206b6003f2e427bb80bab4 100644 (file)
--- a/drivers/cxl/pmem.c
+++ b/drivers/cxl/pmem.c
@@ -85,6 +85,14 @@ static int cxl_nvdimm_probe(struct device *dev)
         if (!nvdimm)
                 return -ENOMEM;
  
+       /*
+        * Set dirty shutdown now, with the expectation that the device
+        * clear it upon a successful GPF flow. The exception to this
+        * is upon Viral detection, per CXL 3.2 section 12.4.2.
+        */
+       if (cxl_dirty_shutdown_state(mds))
+               dev_warn(dev, "GPF: could not dirty shutdown state\n");
+
         dev_set_drvdata(dev, nvdimm);
         return devm_add_action_or_reset(dev, unregister_nvdimm, nvdimm);
  }
author	Davidlohr Bueso <dave@stgolabs.net>
	Fri, 24 Jan 2025 23:35:33 +0000 (15:35 -0800)
committer	Dave Jiang <dave.jiang@intel.com>
	Fri, 14 Mar 2025 22:50:22 +0000 (15:50 -0700)
Documentation/driver-api/cxl/maturity-map.rst		patch \| blob \| history
drivers/cxl/core/core.h		patch \| blob \| history
drivers/cxl/core/mbox.c		patch \| blob \| history
drivers/cxl/core/pci.c		patch \| blob \| history
drivers/cxl/core/port.c		patch \| blob \| history
drivers/cxl/cxl.h		patch \| blob \| history
drivers/cxl/cxlmem.h		patch \| blob \| history
drivers/cxl/cxlpci.h		patch \| blob \| history
drivers/cxl/pmem.c		patch \| blob \| history