1111mul_1x1_neon:
1212 vshl.u64 d2 , d16 , # 8 @ q1 - q3 are slided
1313
14- vmull.p8 q0 , d16 , d17 @ a·bb
14+ vmull.p8 q0 , d16 , d17 @ a·bb
1515 vshl.u64 d4 , d16 , # 16
16- vmull.p8 q1 , d2 , d17 @ a<< 8 ·bb
16+ vmull.p8 q1 , d2 , d17 @ a<< 8 ·bb
1717 vshl.u64 d6 , d16 , # 24
18- vmull.p8 q2 , d4 , d17 @ a<< 16 ·bb
18+ vmull.p8 q2 , d4 , d17 @ a<< 16 ·bb
1919 vshr.u64 d2 , # 8
20- vmull.p8 q3 , d6 , d17 @ a<< 24 ·bb
20+ vmull.p8 q3 , d6 , d17 @ a<< 24 ·bb
2121 vshl.u64 d3 , # 24
2222 veor d0 , d2
2323 vshr.u64 d4 , # 16
@@ -132,20 +132,20 @@ bn_GF2m_mul_2x2:
132132
133133 vmov d16 , d18
134134 vmov d17 , d19
135- bl mul_1x1_neon @ a1·b1
135+ bl mul_1x1_neon @ a1·b1
136136 vmov d22 , d0
137137
138138 vmov d16 , d20
139139 vmov d17 , d21
140- bl mul_1x1_neon @ a0·b0
140+ bl mul_1x1_neon @ a0·b0
141141 vmov d23 , d0
142142
143143 veor d16 , d20 , d18
144144 veor d17 , d21 , d19
145145 veor d20 , d23 , d22
146- bl mul_1x1_neon @ (a0 + a1)·(b0 + b1)
146+ bl mul_1x1_neon @ (a0 + a1)·(b0 + b1)
147147
148- veor d0 , d20 @ (a0 + a1)·(b0 + b1) - a0·b0 - a1·b1
148+ veor d0 , d20 @ (a0 + a1)·(b0 + b1) - a0·b0 - a1·b1
149149 vshl.u64 d1 , d0 , # 32
150150 vshr.u64 d0 , d0 , # 32
151151 veor d23 , d1
@@ -165,7 +165,7 @@ bn_GF2m_mul_2x2:
165165 mov r12 , # 7 << 2
166166 sub sp , sp , # 32 @ allocate tab [ 8 ]
167167
168- bl mul_1x1_ialu @ a1·b1
168+ bl mul_1x1_ialu @ a1·b1
169169 str r5 ,[ r10 , # 8 ]
170170 str r4 ,[ r10 , # 12 ]
171171
@@ -175,13 +175,13 @@ bn_GF2m_mul_2x2:
175175 eor r2 , r2 , r1
176176 eor r0 , r0 , r3
177177 eor r1 , r1 , r2
178- bl mul_1x1_ialu @ a0·b0
178+ bl mul_1x1_ialu @ a0·b0
179179 str r5 ,[ r10 ]
180180 str r4 ,[ r10 , # 4 ]
181181
182182 eor r1 , r1 , r2
183183 eor r0 , r0 , r3
184- bl mul_1x1_ialu @ (a1 + a0)·(b1 + b0)
184+ bl mul_1x1_ialu @ (a1 + a0)·(b1 + b0)
185185 ldmia r10 , {r6 - r9 }
186186 eor r5 , r5 , r4
187187 eor r4 , r4 , r7
0 commit comments