@@ -156,14 +156,9 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
156156extern "C"
157157#endif
158158__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ N } _body_rest_{ uniq_id } (
159- int32_t K_arg ,
159+ int K ,
160160 int8_t *aa, int8_t *bb, int32_t *cc,
161- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
162- int K = K_arg;
163- int A_stride = A_stride_arg;
164- int B_stride = B_stride_arg;
165- int C_stride = C_stride_arg;
166-
161+ int A_stride, int B_stride, int C_stride) {{
167162 int k_base = (K / 4) * 4;
168163 switch ( K % 4 ) {{
169164 case 1:
@@ -205,12 +200,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
205200#endif
206201__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _body_loop_{ uniq_id } (
207202 int8_t *aa, int8_t *bb, int32_t *cc,
208- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
209- int A_stride = A_stride_arg;
210- int B_stride = B_stride_arg;
211- int C_stride = C_stride_arg;
212-
213-
203+ int A_stride, int B_stride, int C_stride) {{
214204 for (int i = 0; i < { M } ; i++) {{
215205 for (int j = 0; j < { N } ; j++) {{
216206 int32_t sum = 0;
@@ -231,11 +221,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
231221#endif
232222__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _body_{ uniq_id } (
233223 int8_t *aa, int8_t *bb, int32_t *cc,
234- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
235- int A_stride = A_stride_arg;
236- int B_stride = B_stride_arg;
237- int C_stride = C_stride_arg;
238-
224+ int A_stride, int B_stride, int C_stride) {{
239225 int16_t bb_pad[{ bb_pad_size } ];
240226 int32_t retcode = 0;
241227
@@ -279,14 +265,9 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
279265extern "C"
280266#endif
281267__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ N } _update_rest_{ uniq_id } (
282- int32_t K_arg ,
268+ int K ,
283269 int8_t *aa, int8_t *bb, int32_t *cc,
284- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
285- int K = K_arg;
286- int A_stride = A_stride_arg;
287- int B_stride = B_stride_arg;
288- int C_stride = C_stride_arg;
289-
270+ int A_stride, int B_stride, int C_stride) {{
290271 int k_base = (K / 4) * 4;
291272 switch ( K % 4 ) {{
292273 case 1:
@@ -328,11 +309,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
328309#endif
329310__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _update_loop_{ uniq_id } (
330311 int8_t *aa, int8_t *bb, int32_t *cc,
331- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
332- int A_stride = A_stride_arg;
333- int B_stride = B_stride_arg;
334- int C_stride = C_stride_arg;
335-
312+ int A_stride, int B_stride, int C_stride) {{
336313 for (int i = 0; i < { M } ; i++) {{
337314 for (int j = 0; j < { N } ; j++) {{
338315 int32_t sum = 0;
@@ -350,11 +327,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
350327#endif
351328__attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _update_{ uniq_id } (
352329 int8_t *aa, int8_t *bb, int32_t *cc,
353- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
354- int A_stride = A_stride_arg;
355- int B_stride = B_stride_arg;
356- int C_stride = C_stride_arg;
357-
330+ int A_stride, int B_stride, int C_stride) {{
358331 int16_t bb_pad[{ bb_pad_size } ];
359332 int32_t retcode = 0;
360333
@@ -395,14 +368,9 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
395368extern "C"
396369#endif
397370__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ N } _body_rest_{ uniq_id } (
398- int32_t K_arg ,
371+ int K ,
399372 int16_t *aa, int16_t *bb, int32_t *cc,
400- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
401- int K = K_arg;
402- int A_stride = A_stride_arg;
403- int B_stride = B_stride_arg;
404- int C_stride = C_stride_arg;
405-
373+ int A_stride, int B_stride, int C_stride) {{
406374 int k_base = (K / 2) * 2;
407375 for (int i = 0; i < { M } ; i++) {{
408376 for (int j = 0; j < { N } ; j++) {{
@@ -419,11 +387,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
419387#endif
420388__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ K } x{ N } _body_loop_{ uniq_id } (
421389 int16_t *aa, int16_t *bb, int32_t *cc,
422- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
423- int A_stride = A_stride_arg;
424- int B_stride = B_stride_arg;
425- int C_stride = C_stride_arg;
426-
390+ int A_stride, int B_stride, int C_stride) {{
427391 for (int i = 0; i < { M } ; i++) {{
428392 for (int j = 0; j < { N } ; j++) {{
429393 int32_t sum = 0;
@@ -444,11 +408,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
444408#endif
445409__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ K } x{ N } _body_{ uniq_id } (
446410 int16_t *aa, int16_t *bb, int32_t *cc,
447- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
448- int A_stride = A_stride_arg;
449- int B_stride = B_stride_arg;
450- int C_stride = C_stride_arg;
451-
411+ int A_stride, int B_stride, int C_stride) {{
452412 int32_t retcode = 0;
453413
454414 if ( { M } < 2 && { N } < 2 ) {{
@@ -490,14 +450,9 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
490450extern "C"
491451#endif
492452__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ N } _update_rest_{ uniq_id } (
493- int32_t K_arg ,
453+ int K ,
494454 int16_t *aa, int16_t *bb, int32_t *cc,
495- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
496- int K = K_arg;
497- int A_stride = A_stride_arg;
498- int B_stride = B_stride_arg;
499- int C_stride = C_stride_arg;
500-
455+ int A_stride, int B_stride, int C_stride) {{
501456 int k_base = (K / 2) * 2;
502457 for (int i = 0; i < { M } ; i++) {{
503458 for (int j = 0; j < { N } ; j++) {{
@@ -514,11 +469,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
514469#endif
515470__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ K } x{ N } _update_loop_{ uniq_id } (
516471 int16_t *aa, int16_t *bb, int32_t *cc,
517- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
518- int A_stride = A_stride_arg;
519- int B_stride = B_stride_arg;
520- int C_stride = C_stride_arg;
521-
472+ int A_stride, int B_stride, int C_stride) {{
522473 for (int i = 0; i < { M } ; i++) {{
523474 for (int j = 0; j < { N } ; j++) {{
524475 int32_t sum = 0;
@@ -536,11 +487,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
536487#endif
537488__attribute__((always_inline)) static inline int32_t gemm16_{ M } x{ K } x{ N } _update_{ uniq_id } (
538489 int16_t *aa, int16_t *bb, int32_t *cc,
539- int32_t A_stride_arg, int32_t B_stride_arg, int32_t C_stride_arg) {{
540- int A_stride = A_stride_arg;
541- int B_stride = B_stride_arg;
542- int C_stride = C_stride_arg;
543-
490+ int A_stride, int B_stride, int C_stride) {{
544491 int32_t retcode = 0;
545492
546493 if ( { M } < 2 && { N } < 2 ) {{
@@ -573,7 +520,7 @@ def gemm_MxKxN_impl(M, K, N, uniq_id):
573520#ifdef __cplusplus
574521extern "C"
575522#endif
576- __attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _reset_{ uniq_id } (int32_t *cc, int32_t C_stride) {{
523+ __attribute__((always_inline)) static inline int32_t gemm_{ M } x{ K } x{ N } _reset_{ uniq_id } (int32_t *cc, int C_stride) {{
577524 for (int i = 0; i < { M } ; i++) {{
578525 for (int j = 0; j < { N } ; j++) {{
579526 cc[i*C_stride + j] = 0;
0 commit comments