#include <linux/acpi.h>
 #include <linux/list.h>
 #include <linux/bitmap.h>
+#include <linux/delay.h>
 #include <linux/slab.h>
 #include <linux/syscore_ops.h>
 #include <linux/interrupt.h>
 static int amd_iommu_enable_interrupts(void);
 static int __init iommu_go_to_state(enum iommu_init_state state);
 static void init_device_table_dma(void);
+static int iommu_pc_get_set_reg(struct amd_iommu *iommu, u8 bank, u8 cntr,
+                               u8 fxn, u64 *value, bool is_write);
 
 static bool amd_iommu_pre_enabled = true;
 
        return 0;
 }
 
-static int iommu_pc_get_set_reg(struct amd_iommu *iommu, u8 bank, u8 cntr,
-                               u8 fxn, u64 *value, bool is_write);
-
-static void init_iommu_perf_ctr(struct amd_iommu *iommu)
+static void __init init_iommu_perf_ctr(struct amd_iommu *iommu)
 {
+       int retry;
        struct pci_dev *pdev = iommu->dev;
-       u64 val = 0xabcd, val2 = 0, save_reg = 0;
+       u64 val = 0xabcd, val2 = 0, save_reg, save_src;
 
        if (!iommu_feature(iommu, FEATURE_PC))
                return;
        amd_iommu_pc_present = true;
 
        /* save the value to restore, if writable */
-       if (iommu_pc_get_set_reg(iommu, 0, 0, 0, &save_reg, false))
+       if (iommu_pc_get_set_reg(iommu, 0, 0, 0, &save_reg, false) ||
+           iommu_pc_get_set_reg(iommu, 0, 0, 8, &save_src, false))
                goto pc_false;
 
-       /* Check if the performance counters can be written to */
-       if ((iommu_pc_get_set_reg(iommu, 0, 0, 0, &val, true)) ||
-           (iommu_pc_get_set_reg(iommu, 0, 0, 0, &val2, false)) ||
-           (val != val2))
+       /*
+        * Disable power gating by programing the performance counter
+        * source to 20 (i.e. counts the reads and writes from/to IOMMU
+        * Reserved Register [MMIO Offset 1FF8h] that are ignored.),
+        * which never get incremented during this init phase.
+        * (Note: The event is also deprecated.)
+        */
+       val = 20;
+       if (iommu_pc_get_set_reg(iommu, 0, 0, 8, &val, true))
                goto pc_false;
 
+       /* Check if the performance counters can be written to */
+       val = 0xabcd;
+       for (retry = 5; retry; retry--) {
+               if (iommu_pc_get_set_reg(iommu, 0, 0, 0, &val, true) ||
+                   iommu_pc_get_set_reg(iommu, 0, 0, 0, &val2, false) ||
+                   val2)
+                       break;
+
+               /* Wait about 20 msec for power gating to disable and retry. */
+               msleep(20);
+       }
+
        /* restore */
-       if (iommu_pc_get_set_reg(iommu, 0, 0, 0, &save_reg, true))
+       if (iommu_pc_get_set_reg(iommu, 0, 0, 0, &save_reg, true) ||
+           iommu_pc_get_set_reg(iommu, 0, 0, 8, &save_src, true))
+               goto pc_false;
+
+       if (val != val2)
                goto pc_false;
 
        pci_info(pdev, "IOMMU performance counters supported\n");