@@ -1215,10 +1215,10 @@ define void @store_i8_stride7_vf8(ptr %in.vecptr0, ptr %in.vecptr1, ptr %in.vecp
12151215; AVX512BW-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zero,zero,zero,zero,zmm0[0],zero,zero,zero,zero,zero,zero,zmm0[1],zero,zero,zero,zero,zmm0[18,26],zero,zero,zero,zero,zero,zmm0[19,27],zero,zero,zero,zero,zero,zero,zero,zmm0[36],zero,zero,zero,zero,zero,zero,zmm0[37],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm0[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero
12161216; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
12171217; AVX512BW-NEXT: vinserti64x4 $1, %ymm2, %zmm2, %zmm1
1218- ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm2 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1219- ; AVX512BW-NEXT: vpermq {{.*#+}} zmm1 = zmm1 [2,3,0,1,6,7,4,5 ]
1220- ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm1 = zero,zero,zmm1 [0,8],zero,zero,zero,zero,zero,zmm1 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm1 [19,27],zero,zero,zero,zero,zero,zmm1 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm1 [37,45],zero,zero,zero,zero,zero,zmm1 [38,46],zero,zero,zero,zmm1 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1221- ; AVX512BW-NEXT: vporq %zmm2 , %zmm1 , %zmm1
1218+ ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm1 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1219+ ; AVX512BW-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2 [2,3,0,1,2,3,0,1 ]
1220+ ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm2 = zero,zero,zmm2 [0,8],zero,zero,zero,zero,zero,zmm2 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm2 [19,27],zero,zero,zero,zero,zero,zmm2 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm2 [37,45],zero,zero,zero,zero,zero,zmm2 [38,46],zero,zero,zero,zmm2 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1221+ ; AVX512BW-NEXT: vporq %zmm1 , %zmm2 , %zmm1
12221222; AVX512BW-NEXT: movabsq $63546854584629360, %rcx # imm = 0xE1C3870E1C3870
12231223; AVX512BW-NEXT: kmovq %rcx, %k1
12241224; AVX512BW-NEXT: vmovdqu8 %zmm0, %zmm1 {%k1}
@@ -1294,10 +1294,10 @@ define void @store_i8_stride7_vf8(ptr %in.vecptr0, ptr %in.vecptr1, ptr %in.vecp
12941294; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zero,zero,zero,zero,zmm0[0],zero,zero,zero,zero,zero,zero,zmm0[1],zero,zero,zero,zero,zmm0[18,26],zero,zero,zero,zero,zero,zmm0[19,27],zero,zero,zero,zero,zero,zero,zero,zmm0[36],zero,zero,zero,zero,zero,zero,zmm0[37],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm0[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero
12951295; AVX512DQ-BW-NEXT: vporq %zmm1, %zmm0, %zmm0
12961296; AVX512DQ-BW-NEXT: vinserti64x4 $1, %ymm2, %zmm2, %zmm1
1297- ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm2 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1298- ; AVX512DQ-BW-NEXT: vpermq {{.*#+}} zmm1 = zmm1 [2,3,0,1,6,7,4,5 ]
1299- ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm1 = zero,zero,zmm1 [0,8],zero,zero,zero,zero,zero,zmm1 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm1 [19,27],zero,zero,zero,zero,zero,zmm1 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm1 [37,45],zero,zero,zero,zero,zero,zmm1 [38,46],zero,zero,zero,zmm1 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1300- ; AVX512DQ-BW-NEXT: vporq %zmm2 , %zmm1 , %zmm1
1297+ ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm1 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1298+ ; AVX512DQ-BW-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2 [2,3,0,1,2,3,0,1 ]
1299+ ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm2 = zero,zero,zmm2 [0,8],zero,zero,zero,zero,zero,zmm2 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm2 [19,27],zero,zero,zero,zero,zero,zmm2 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm2 [37,45],zero,zero,zero,zero,zero,zmm2 [38,46],zero,zero,zero,zmm2 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1300+ ; AVX512DQ-BW-NEXT: vporq %zmm1 , %zmm2 , %zmm1
13011301; AVX512DQ-BW-NEXT: movabsq $63546854584629360, %rcx # imm = 0xE1C3870E1C3870
13021302; AVX512DQ-BW-NEXT: kmovq %rcx, %k1
13031303; AVX512DQ-BW-NEXT: vmovdqu8 %zmm0, %zmm1 {%k1}
0 commit comments