crypto: arm/chacha20 - always use vrev for 16-bit rotates

author Eric Biggers <ebiggers@google.com>

Wed, 25 Jul 2018 01:29:07 +0000 (18:29 -0700)

committer Herbert Xu <herbert@gondor.apana.org.au>

Fri, 3 Aug 2018 10:06:05 +0000 (18:06 +0800)
author Eric Biggers <ebiggers@google.com>
Wed, 25 Jul 2018 01:29:07 +0000 (18:29 -0700)
committer Herbert Xu <herbert@gondor.apana.org.au>
Fri, 3 Aug 2018 10:06:05 +0000 (18:06 +0800)
diff --git a/arch/arm/crypto/chacha20-neon-core.S b/arch/arm/crypto/chacha20-neon-core.S

index 3fecb2124c35a0b35b680a86216be0bd5a27e92d..451a849ad5186a4a985a5466ac4a0431e26052d8 100644 (file)
--- a/arch/arm/crypto/chacha20-neon-core.S
+++ b/arch/arm/crypto/chacha20-neon-core.S
@@ -51,9 +51,8 @@ ENTRY(chacha20_block_xor_neon)
  .Ldoubleround:
         // x0 += x1, x3 = rotl32(x3 ^ x0, 16)
         vadd.i32        q0, q0, q1
-       veor            q4, q3, q0
-       vshl.u32        q3, q4, #16
-       vsri.u32        q3, q4, #16
+       veor            q3, q3, q0
+       vrev32.16       q3, q3
  
         // x2 += x3, x1 = rotl32(x1 ^ x2, 12)
         vadd.i32        q2, q2, q3
@@ -82,9 +81,8 @@ ENTRY(chacha20_block_xor_neon)
  
         // x0 += x1, x3 = rotl32(x3 ^ x0, 16)
         vadd.i32        q0, q0, q1
-       veor            q4, q3, q0
-       vshl.u32        q3, q4, #16
-       vsri.u32        q3, q4, #16
+       veor            q3, q3, q0
+       vrev32.16       q3, q3
  
         // x2 += x3, x1 = rotl32(x1 ^ x2, 12)
         vadd.i32        q2, q2, q3
author	Eric Biggers <ebiggers@google.com>
	Wed, 25 Jul 2018 01:29:07 +0000 (18:29 -0700)
committer	Herbert Xu <herbert@gondor.apana.org.au>
	Fri, 3 Aug 2018 10:06:05 +0000 (18:06 +0800)