--- /dev/null
+/* SPDX-License-Identifier: GPL-2.0-or-later */
+/*
+ * inet_dscp.h: helpers for handling differentiated services codepoints (DSCP)
+ *
+ * DSCP is defined in RFC 2474:
+ *
+ *        0   1   2   3   4   5   6   7
+ *      +---+---+---+---+---+---+---+---+
+ *      |         DSCP          |  CU   |
+ *      +---+---+---+---+---+---+---+---+
+ *
+ *        DSCP: differentiated services codepoint
+ *        CU:   currently unused
+ *
+ * The whole DSCP + CU bits form the DS field.
+ * The DS field is also commonly called TOS or Traffic Class (for IPv6).
+ *
+ * Note: the CU bits are now used for Explicit Congestion Notification
+ *       (RFC 3168).
+ */
+
+#ifndef _INET_DSCP_H
+#define _INET_DSCP_H
+
+#include <linux/types.h>
+
+/* Special type for storing DSCP values.
+ *
+ * A dscp_t variable stores a DS field with the CU (ECN) bits cleared.
+ * Using dscp_t allows to strictly separate DSCP and ECN bits, thus avoiding
+ * bugs where ECN bits are erroneously taken into account during FIB lookups
+ * or policy routing.
+ *
+ * Note: to get the real DSCP value contained in a dscp_t variable one would
+ * have to do a bit shift after calling inet_dscp_to_dsfield(). We could have
+ * a helper for that, but there's currently no users.
+ */
+typedef u8 __bitwise dscp_t;
+
+#define INET_DSCP_MASK 0xfc
+
+static inline dscp_t inet_dsfield_to_dscp(__u8 dsfield)
+{
+       return (__force dscp_t)(dsfield & INET_DSCP_MASK);
+}
+
+static inline __u8 inet_dscp_to_dsfield(dscp_t dscp)
+{
+       return (__force __u8)dscp;
+}
+
+static inline bool inet_validate_dscp(__u8 val)
+{
+       return !(val & ~INET_DSCP_MASK);
+}
+
+#endif /* _INET_DSCP_H */
 
 #include <net/if_inet6.h>
 #include <net/flow.h>
 #include <net/flow_dissector.h>
+#include <net/inet_dscp.h>
 #include <net/snmp.h>
 #include <net/netns/hash.h>
 
        return ntohl(flowinfo & IPV6_TCLASS_MASK) >> IPV6_TCLASS_SHIFT;
 }
 
+static inline dscp_t ip6_dscp(__be32 flowinfo)
+{
+       return inet_dsfield_to_dscp(ip6_tclass(flowinfo));
+}
+
 static inline __be32 ip6_make_flowinfo(unsigned int tclass, __be32 flowlabel)
 {
        return htonl(tclass << IPV6_TCLASS_SHIFT) | flowlabel;
 
 #include <linux/indirect_call_wrapper.h>
 
 #include <net/fib_rules.h>
+#include <net/inet_dscp.h>
 #include <net/ipv6.h>
 #include <net/addrconf.h>
 #include <net/ip6_route.h>
        struct fib_rule         common;
        struct rt6key           src;
        struct rt6key           dst;
-       u8                      tclass;
+       dscp_t                  dscp;
 };
 
 static bool fib6_rule_matchall(const struct fib_rule *rule)
 {
        struct fib6_rule *r = container_of(rule, struct fib6_rule, common);
 
-       if (r->dst.plen || r->src.plen || r->tclass)
+       if (r->dst.plen || r->src.plen || r->dscp)
                return false;
        return fib_rule_matchall(rule);
 }
                        return 0;
        }
 
-       if (r->tclass && r->tclass != ip6_tclass(fl6->flowlabel))
+       if (r->dscp && r->dscp != ip6_dscp(fl6->flowlabel))
                return 0;
 
        if (rule->ip_proto && (rule->ip_proto != fl6->flowi6_proto))
        struct net *net = sock_net(skb->sk);
        struct fib6_rule *rule6 = (struct fib6_rule *) rule;
 
+       if (!inet_validate_dscp(frh->tos)) {
+               NL_SET_ERR_MSG(extack,
+                              "Invalid dsfield (tos): ECN bits must be 0");
+               goto errout;
+       }
+       rule6->dscp = inet_dsfield_to_dscp(frh->tos);
+
        if (rule->action == FR_ACT_TO_TBL && !rule->l3mdev) {
                if (rule->table == RT6_TABLE_UNSPEC) {
                        NL_SET_ERR_MSG(extack, "Invalid table");
 
        rule6->src.plen = frh->src_len;
        rule6->dst.plen = frh->dst_len;
-       rule6->tclass = frh->tos;
 
        if (fib_rule_requires_fldissect(rule))
                net->ipv6.fib6_rules_require_fldissect++;
        if (frh->dst_len && (rule6->dst.plen != frh->dst_len))
                return 0;
 
-       if (frh->tos && (rule6->tclass != frh->tos))
+       if (frh->tos && inet_dscp_to_dsfield(rule6->dscp) != frh->tos)
                return 0;
 
        if (frh->src_len &&
 
        frh->dst_len = rule6->dst.plen;
        frh->src_len = rule6->src.plen;
-       frh->tos = rule6->tclass;
+       frh->tos = inet_dscp_to_dsfield(rule6->dscp);
 
        if ((rule6->dst.plen &&
             nla_put_in6_addr(skb, FRA_DST, &rule6->dst.addr)) ||
 
        log_test $? 0 "rule6 del by pref: $description"
 }
 
+fib_rule6_test_reject()
+{
+       local match="$1"
+       local rc
+
+       $IP -6 rule add $match table $RTABLE 2>/dev/null
+       rc=$?
+       log_test $rc 2 "rule6 check: $match"
+
+       if [ $rc -eq 0 ]; then
+               $IP -6 rule del $match table $RTABLE
+       fi
+}
+
 fib_rule6_test()
 {
        local getmatch
        local match
+       local cnt
 
        # setup the fib rule redirect route
        $IP -6 route add table $RTABLE default via $GW_IP6 dev $DEV onlink
        match="from $SRC_IP6 iif $DEV"
        fib_rule6_test_match_n_redirect "$match" "$match" "iif redirect to table"
 
+       # Reject dsfield (tos) options which have ECN bits set
+       for cnt in $(seq 1 3); do
+               match="dsfield $cnt"
+               fib_rule6_test_reject "$match"
+       done
+
+       # Don't take ECN bits into account when matching on dsfield
        match="tos 0x10"
-       fib_rule6_test_match_n_redirect "$match" "$match" "tos redirect to table"
+       for cnt in "0x10" "0x11" "0x12" "0x13"; do
+               # Using option 'tos' instead of 'dsfield' as old iproute2
+               # versions don't support 'dsfield' in ip rule show.
+               getmatch="tos $cnt"
+               fib_rule6_test_match_n_redirect "$match" "$getmatch" \
+                                               "$getmatch redirect to table"
+       done
 
        match="fwmark 0x64"
        getmatch="mark 0x64"