@@ -357,14 +357,14 @@ define i64 @test_v8i64(<8 x i64> %a0) {
357
357
; AVX512BW-LABEL: test_v8i64:
358
358
; AVX512BW: # %bb.0:
359
359
; AVX512BW-NEXT: vextracti64x4 $1, %zmm0, %ymm1
360
- ; AVX512BW-NEXT: vpsrlq $32, %zmm0 , %zmm2
361
- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
362
- ; AVX512BW-NEXT: vpsrlq $32, %zmm1 , %zmm3
363
- ; AVX512BW-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
364
- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
365
- ; AVX512BW-NEXT: vpsllq $32, %zmm2 , %zmm2
366
- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
367
- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
360
+ ; AVX512BW-NEXT: vpsrlq $32, %ymm0 , %ymm2
361
+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
362
+ ; AVX512BW-NEXT: vpsrlq $32, %ymm1 , %ymm3
363
+ ; AVX512BW-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
364
+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
365
+ ; AVX512BW-NEXT: vpsllq $32, %ymm2 , %ymm2
366
+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
367
+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
368
368
; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
369
369
; AVX512BW-NEXT: vpsrlq $32, %xmm0, %xmm2
370
370
; AVX512BW-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -390,14 +390,14 @@ define i64 @test_v8i64(<8 x i64> %a0) {
390
390
; AVX512BWVL-LABEL: test_v8i64:
391
391
; AVX512BWVL: # %bb.0:
392
392
; AVX512BWVL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
393
- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm0 , %zmm2
394
- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
395
- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm1 , %zmm3
396
- ; AVX512BWVL-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
397
- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
398
- ; AVX512BWVL-NEXT: vpsllq $32, %zmm2 , %zmm2
399
- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
400
- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
393
+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm0 , %ymm2
394
+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
395
+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm1 , %ymm3
396
+ ; AVX512BWVL-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
397
+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
398
+ ; AVX512BWVL-NEXT: vpsllq $32, %ymm2 , %ymm2
399
+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
400
+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
401
401
; AVX512BWVL-NEXT: vextracti128 $1, %ymm0, %xmm1
402
402
; AVX512BWVL-NEXT: vpsrlq $32, %xmm0, %xmm2
403
403
; AVX512BWVL-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -667,14 +667,14 @@ define i64 @test_v16i64(<16 x i64> %a0) {
667
667
; AVX512BW-NEXT: vpmuludq %zmm1, %zmm0, %zmm0
668
668
; AVX512BW-NEXT: vpaddq %zmm2, %zmm0, %zmm0
669
669
; AVX512BW-NEXT: vextracti64x4 $1, %zmm0, %ymm1
670
- ; AVX512BW-NEXT: vpsrlq $32, %zmm0 , %zmm2
671
- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
672
- ; AVX512BW-NEXT: vpsrlq $32, %zmm1 , %zmm3
673
- ; AVX512BW-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
674
- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
675
- ; AVX512BW-NEXT: vpsllq $32, %zmm2 , %zmm2
676
- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
677
- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
670
+ ; AVX512BW-NEXT: vpsrlq $32, %ymm0 , %ymm2
671
+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
672
+ ; AVX512BW-NEXT: vpsrlq $32, %ymm1 , %ymm3
673
+ ; AVX512BW-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
674
+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
675
+ ; AVX512BW-NEXT: vpsllq $32, %ymm2 , %ymm2
676
+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
677
+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
678
678
; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
679
679
; AVX512BW-NEXT: vpsrlq $32, %xmm0, %xmm2
680
680
; AVX512BW-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -708,14 +708,14 @@ define i64 @test_v16i64(<16 x i64> %a0) {
708
708
; AVX512BWVL-NEXT: vpmuludq %zmm1, %zmm0, %zmm0
709
709
; AVX512BWVL-NEXT: vpaddq %zmm2, %zmm0, %zmm0
710
710
; AVX512BWVL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
711
- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm0 , %zmm2
712
- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
713
- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm1 , %zmm3
714
- ; AVX512BWVL-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
715
- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
716
- ; AVX512BWVL-NEXT: vpsllq $32, %zmm2 , %zmm2
717
- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
718
- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
711
+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm0 , %ymm2
712
+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
713
+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm1 , %ymm3
714
+ ; AVX512BWVL-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
715
+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
716
+ ; AVX512BWVL-NEXT: vpsllq $32, %ymm2 , %ymm2
717
+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
718
+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
719
719
; AVX512BWVL-NEXT: vextracti128 $1, %ymm0, %xmm1
720
720
; AVX512BWVL-NEXT: vpsrlq $32, %xmm0, %xmm2
721
721
; AVX512BWVL-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
0 commit comments