powerpc32: optimise csum_partial() loop

author Christophe Leroy <christophe.leroy@c-s.fr>

Tue, 22 Sep 2015 14:34:32 +0000 (16:34 +0200)

committer Scott Wood <oss@buserror.net>

Sat, 5 Mar 2016 05:03:45 +0000 (23:03 -0600)
author Christophe Leroy <christophe.leroy@c-s.fr>
Tue, 22 Sep 2015 14:34:32 +0000 (16:34 +0200)
committer Scott Wood <oss@buserror.net>
Sat, 5 Mar 2016 05:03:45 +0000 (23:03 -0600)
diff --git a/arch/powerpc/lib/checksum_32.S b/arch/powerpc/lib/checksum_32.S

index 9c126028ab9c3d7c533aa613f247d2815beb3f30..0d34f47c8a5e88e2bfc982e415ec92aff08d4703 100644 (file)
--- a/arch/powerpc/lib/checksum_32.S
+++ b/arch/powerpc/lib/checksum_32.S
@@ -38,10 +38,24 @@ _GLOBAL(csum_partial)
         srwi.   r6,r4,2         /* # words to do */
         adde    r5,r5,r0
         beq     3f
-1:     mtctr   r6
+1:     andi.   r6,r6,3         /* Prepare to handle words 4 by 4 */
+       beq     21f
+       mtctr   r6
  2:     lwzu    r0,4(r3)
         adde    r5,r5,r0
         bdnz    2b
+21:    srwi.   r6,r4,4         /* # blocks of 4 words to do */
+       beq     3f
+       mtctr   r6
+22:    lwz     r0,4(r3)
+       lwz     r6,8(r3)
+       lwz     r7,12(r3)
+       lwzu    r8,16(r3)
+       adde    r5,r5,r0
+       adde    r5,r5,r6
+       adde    r5,r5,r7
+       adde    r5,r5,r8
+       bdnz    22b
  3:     andi.   r0,r4,2
         beq+    4f
         lhz     r0,4(r3)
author	Christophe Leroy <christophe.leroy@c-s.fr>
	Tue, 22 Sep 2015 14:34:32 +0000 (16:34 +0200)
committer	Scott Wood <oss@buserror.net>
	Sat, 5 Mar 2016 05:03:45 +0000 (23:03 -0600)