ibmvnic: fix race between xmit and reset

author Sukadev Bhattiprolu <sukadev@linux.ibm.com>

Thu, 17 Mar 2022 01:12:31 +0000 (18:12 -0700)

committer David S. Miller <davem@davemloft.net>

Fri, 18 Mar 2022 13:22:22 +0000 (13:22 +0000)
author Sukadev Bhattiprolu <sukadev@linux.ibm.com>
Thu, 17 Mar 2022 01:12:31 +0000 (18:12 -0700)
committer David S. Miller <davem@davemloft.net>
Fri, 18 Mar 2022 13:22:22 +0000 (13:22 +0000)
diff --git a/drivers/net/ethernet/ibm/ibmvnic.c b/drivers/net/ethernet/ibm/ibmvnic.c

index b423e94956f1088a1b27afa963597e1873f8c4fc..b4804ce63151f3fcf622137eb152f983628c7ffd 100644 (file)
--- a/drivers/net/ethernet/ibm/ibmvnic.c
+++ b/drivers/net/ethernet/ibm/ibmvnic.c
@@ -1429,6 +1429,15 @@ static int __ibmvnic_open(struct net_device *netdev)
                 return rc;
         }
  
+       adapter->tx_queues_active = true;
+
+       /* Since queues were stopped until now, there shouldn't be any
+        * one in ibmvnic_complete_tx() or ibmvnic_xmit() so maybe we
+        * don't need the synchronize_rcu()? Leaving it for consistency
+        * with setting ->tx_queues_active = false.
+        */
+       synchronize_rcu();
+
         netif_tx_start_all_queues(netdev);
  
         if (prev_state == VNIC_CLOSED) {
@@ -1603,6 +1612,14 @@ static void ibmvnic_cleanup(struct net_device *netdev)
         struct ibmvnic_adapter *adapter = netdev_priv(netdev);
  
         /* ensure that transmissions are stopped if called by do_reset */
+
+       adapter->tx_queues_active = false;
+
+       /* Ensure complete_tx() and ibmvnic_xmit() see ->tx_queues_active
+        * update so they don't restart a queue after we stop it below.
+        */
+       synchronize_rcu();
+
         if (test_bit(0, &adapter->resetting))
                 netif_tx_disable(netdev);
         else
@@ -1842,14 +1859,21 @@ static void ibmvnic_tx_scrq_clean_buffer(struct ibmvnic_adapter *adapter,
                 tx_buff->skb = NULL;
                 adapter->netdev->stats.tx_dropped++;
         }
+
         ind_bufp->index = 0;
+
         if (atomic_sub_return(entries, &tx_scrq->used) <=
             (adapter->req_tx_entries_per_subcrq / 2) &&
-           __netif_subqueue_stopped(adapter->netdev, queue_num) &&
-           !test_bit(0, &adapter->resetting)) {
-               netif_wake_subqueue(adapter->netdev, queue_num);
-               netdev_dbg(adapter->netdev, "Started queue %d\n",
-                          queue_num);
+           __netif_subqueue_stopped(adapter->netdev, queue_num)) {
+               rcu_read_lock();
+
+               if (adapter->tx_queues_active) {
+                       netif_wake_subqueue(adapter->netdev, queue_num);
+                       netdev_dbg(adapter->netdev, "Started queue %d\n",
+                                  queue_num);
+               }
+
+               rcu_read_unlock();
         }
  }
  
@@ -1904,11 +1928,12 @@ static netdev_tx_t ibmvnic_xmit(struct sk_buff *skb, struct net_device *netdev)
         int index = 0;
         u8 proto = 0;
  
-       tx_scrq = adapter->tx_scrq[queue_num];
-       txq = netdev_get_tx_queue(netdev, queue_num);
-       ind_bufp = &tx_scrq->ind_buf;
-
-       if (test_bit(0, &adapter->resetting)) {
+       /* If a reset is in progress, drop the packet since
+        * the scrqs may get torn down. Otherwise use the
+        * rcu to ensure reset waits for us to complete.
+        */
+       rcu_read_lock();
+       if (!adapter->tx_queues_active) {
                 dev_kfree_skb_any(skb);
  
                 tx_send_failed++;
@@ -1917,6 +1942,10 @@ static netdev_tx_t ibmvnic_xmit(struct sk_buff *skb, struct net_device *netdev)
                 goto out;
         }
  
+       tx_scrq = adapter->tx_scrq[queue_num];
+       txq = netdev_get_tx_queue(netdev, queue_num);
+       ind_bufp = &tx_scrq->ind_buf;
+
         if (ibmvnic_xmit_workarounds(skb, netdev)) {
                 tx_dropped++;
                 tx_send_failed++;
@@ -1924,6 +1953,7 @@ static netdev_tx_t ibmvnic_xmit(struct sk_buff *skb, struct net_device *netdev)
                 ibmvnic_tx_scrq_flush(adapter, tx_scrq);
                 goto out;
         }
+
         if (skb_is_gso(skb))
                 tx_pool = &adapter->tso_pool[queue_num];
         else
@@ -2078,6 +2108,7 @@ tx_err:
                 netif_carrier_off(netdev);
         }
  out:
+       rcu_read_unlock();
         netdev->stats.tx_dropped += tx_dropped;
         netdev->stats.tx_bytes += tx_bytes;
         netdev->stats.tx_packets += tx_packets;
@@ -3732,9 +3763,15 @@ restart_loop:
                     (adapter->req_tx_entries_per_subcrq / 2) &&
                     __netif_subqueue_stopped(adapter->netdev,
                                              scrq->pool_index)) {
-                       netif_wake_subqueue(adapter->netdev, scrq->pool_index);
-                       netdev_dbg(adapter->netdev, "Started queue %d\n",
-                                  scrq->pool_index);
+                       rcu_read_lock();
+                       if (adapter->tx_queues_active) {
+                               netif_wake_subqueue(adapter->netdev,
+                                                   scrq->pool_index);
+                               netdev_dbg(adapter->netdev,
+                                          "Started queue %d\n",
+                                          scrq->pool_index);
+                       }
+                       rcu_read_unlock();
                 }
         }
  
diff --git a/drivers/net/ethernet/ibm/ibmvnic.h b/drivers/net/ethernet/ibm/ibmvnic.h

index fa2d607a7b1b9712930267d96f1b644c1a1ddc98..8f5cefb932dd1e48717a3b2fc9cb2f8e0b3fc9f4 100644 (file)
--- a/drivers/net/ethernet/ibm/ibmvnic.h
+++ b/drivers/net/ethernet/ibm/ibmvnic.h
@@ -1006,11 +1006,14 @@ struct ibmvnic_adapter {
         struct work_struct ibmvnic_reset;
         struct delayed_work ibmvnic_delayed_reset;
         unsigned long resetting;
-       bool napi_enabled, from_passive_init;
-       bool login_pending;
         /* last device reset time */
         unsigned long last_reset_time;
  
+       bool napi_enabled;
+       bool from_passive_init;
+       bool login_pending;
+       /* protected by rcu */
+       bool tx_queues_active;
         bool failover_pending;
         bool force_reset_recovery;
author	Sukadev Bhattiprolu <sukadev@linux.ibm.com>
	Thu, 17 Mar 2022 01:12:31 +0000 (18:12 -0700)
committer	David S. Miller <davem@davemloft.net>
	Fri, 18 Mar 2022 13:22:22 +0000 (13:22 +0000)
drivers/net/ethernet/ibm/ibmvnic.c		patch \| blob \| history
drivers/net/ethernet/ibm/ibmvnic.h		patch \| blob \| history