.fill_size = XSK_RING_PROD__DEFAULT_NUM_DESCS,
                .comp_size = XSK_RING_CONS__DEFAULT_NUM_DESCS,
                .frame_size = XSK_UMEM__DEFAULT_FRAME_SIZE,
-               .flags = XDP_UMEM_UNALIGNED_CHUNK_FLAG,
+               .flags = XDP_UMEM_UNALIGNED_CHUNK_FLAG | XDP_UMEM_TX_SW_CSUM,
+               .tx_metadata_len = sizeof(struct xsk_tx_metadata),
        };
        __u32 idx;
        u64 addr;
 
 static int generate_packet(struct xsk *xsk, __u16 dst_port)
 {
+       struct xsk_tx_metadata *meta;
        struct xdp_desc *tx_desc;
        struct udphdr *udph;
        struct ethhdr *eth;
                return -1;
 
        tx_desc = xsk_ring_prod__tx_desc(&xsk->tx, idx);
-       tx_desc->addr = idx % (UMEM_NUM / 2) * UMEM_FRAME_SIZE;
+       tx_desc->addr = idx % (UMEM_NUM / 2) * UMEM_FRAME_SIZE + sizeof(struct xsk_tx_metadata);
        printf("%p: tx_desc[%u]->addr=%llx\n", xsk, idx, tx_desc->addr);
        data = xsk_umem__get_data(xsk->umem_area, tx_desc->addr);
 
+       meta = data - sizeof(struct xsk_tx_metadata);
+       memset(meta, 0, sizeof(*meta));
+       meta->flags = XDP_TXMD_FLAGS_TIMESTAMP;
+
        eth = data;
        iph = (void *)(eth + 1);
        udph = (void *)(iph + 1);
        udph->source = htons(AF_XDP_SOURCE_PORT);
        udph->dest = htons(dst_port);
        udph->len = htons(sizeof(*udph) + UDP_PAYLOAD_BYTES);
-       udph->check = 0;
+       udph->check = ~csum_tcpudp_magic(iph->saddr, iph->daddr,
+                                        ntohs(udph->len), IPPROTO_UDP, 0);
 
        memset(udph + 1, 0xAA, UDP_PAYLOAD_BYTES);
 
+       meta->flags |= XDP_TXMD_FLAGS_CHECKSUM;
+       meta->request.csum_start = sizeof(*eth) + sizeof(*iph);
+       meta->request.csum_offset = offsetof(struct udphdr, check);
+
        tx_desc->len = sizeof(*eth) + sizeof(*iph) + sizeof(*udph) + UDP_PAYLOAD_BYTES;
+       tx_desc->options |= XDP_TX_METADATA;
        xsk_ring_prod__submit(&xsk->tx, 1);
 
        ret = sendto(xsk_socket__fd(xsk->socket), NULL, 0, MSG_DONTWAIT, NULL, 0);
 
 static void complete_tx(struct xsk *xsk)
 {
-       __u32 idx;
+       struct xsk_tx_metadata *meta;
        __u64 addr;
+       void *data;
+       __u32 idx;
 
        if (ASSERT_EQ(xsk_ring_cons__peek(&xsk->comp, 1, &idx), 1, "xsk_ring_cons__peek")) {
                addr = *xsk_ring_cons__comp_addr(&xsk->comp, idx);
 
                printf("%p: complete tx idx=%u addr=%llx\n", xsk, idx, addr);
+
+               data = xsk_umem__get_data(xsk->umem_area, addr);
+               meta = data - sizeof(struct xsk_tx_metadata);
+
+               ASSERT_NEQ(meta->completion.tx_timestamp, 0, "tx_timestamp");
+
                xsk_ring_cons__release(&xsk->comp, 1);
        }
 }
        const struct xdp_desc *rx_desc;
        struct pollfd fds = {};
        struct xdp_meta *meta;
+       struct udphdr *udph;
        struct ethhdr *eth;
        struct iphdr *iph;
        __u64 comp_addr;
        ASSERT_EQ(eth->h_proto, htons(ETH_P_IP), "eth->h_proto");
        iph = (void *)(eth + 1);
        ASSERT_EQ((int)iph->version, 4, "iph->version");
+       udph = (void *)(iph + 1);
 
        /* custom metadata */
 
 
        ASSERT_EQ(meta->rx_hash_type, 0, "rx_hash_type");
 
+       /* checksum offload */
+       ASSERT_EQ(udph->check, htons(0x721c), "csum");
+
        xsk_ring_cons__release(&xsk->rx, 1);
        refill_rx(xsk, comp_addr);