dotnet · Jun 10, 2024
diff --git a/‎src/coreclr/jit/hwintrinsiclistxarch.h
-10 b/‎src/coreclr/jit/hwintrinsiclistxarch.h
-10
diff --git a/‎src/coreclr/jit/hwintrinsicxarch.cpp
+1-1 b/‎src/coreclr/jit/hwintrinsicxarch.cpp
+1-1
diff --git a/‎src/coreclr/jit/importercalls.cpp
+10-10 b/‎src/coreclr/jit/importercalls.cpp
+10-10
diff --git a/‎src/coreclr/jit/lowerxarch.cpp
+19-34 b/‎src/coreclr/jit/lowerxarch.cpp
+19-34
diff --git a/‎src/coreclr/jit/lsraxarch.cpp
-10 b/‎src/coreclr/jit/lsraxarch.cpp
-10
diff --git a/‎src/coreclr/jit/simdashwintrinsic.cpp
+1-1 b/‎src/coreclr/jit/simdashwintrinsic.cpp
+1-1
diff --git a/‎src/coreclr/vm/codeman.cpp
+6-6 b/‎src/coreclr/vm/codeman.cpp
+6-6
diff --git a/‎src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/X86/Avx10v1.PlatformNotSupported.cs
-224 b/‎src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/X86/Avx10v1.PlatformNotSupported.cs
-224
diff --git a/‎src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/X86/Avx10v1.cs
-224 b/‎src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/X86/Avx10v1.cs
-224
diff --git a/‎src/libraries/System.Runtime.Intrinsics/ref/System.Runtime.Intrinsics.cs
+10-41 b/‎src/libraries/System.Runtime.Intrinsics/ref/System.Runtime.Intrinsics.cs
+10-41
@@ -1185,18 +1185,8 @@ HARDWARE_INTRINSIC(AVX10v1,         GetMantissaScalar,
 HARDWARE_INTRINSIC(AVX10v1,         LeadingZeroCount,                           -1,              1,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_vplzcntd,           INS_vplzcntd,           INS_vplzcntq,           INS_vplzcntq,           INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
 HARDWARE_INTRINSIC(AVX10v1,         Max,                                        -1,              2,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vpmaxsq,            INS_vpmaxuq,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible|HW_Flag_Commutative)
 HARDWARE_INTRINSIC(AVX10v1,         Min,                                        -1,              2,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vpminsq,            INS_vpminuq,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible|HW_Flag_Commutative)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplyAdd,                                -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmadd213ps,        INS_vfmadd213pd},       HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplyAddNegated,                         -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfnmadd213ps,       INS_vfnmadd213pd},      HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplyAddNegatedScalar,                   16,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfnmadd213ss,       INS_vfnmadd213sd},      HW_Category_SIMDScalar,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_CopyUpperBits)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplyAddScalar,                          16,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmadd213ss,        INS_vfmadd213sd},       HW_Category_SIMDScalar,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_CopyUpperBits)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplyAddSubtract,                        -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmaddsub213ps,     INS_vfmaddsub213pd},    HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
 HARDWARE_INTRINSIC(AVX10v1,         MultiplyLow,                                -1,              2,     false,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vpmullq,            INS_vpmullq,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_Commutative|HW_Flag_EmbMaskingCompatible)
 HARDWARE_INTRINSIC(AVX10v1,         MultiplyScalar,                             16,             -1,     false,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_mulss,              INS_mulsd},             HW_Category_SIMDScalar,             HW_Flag_CopyUpperBits|HW_Flag_EmbRoundingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplySubtract,                           -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmsub213ps,        INS_vfmsub213pd},       HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplySubtractAdd,                        -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmsubadd213ps,     INS_vfmsubadd213pd},    HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplySubtractNegated,                    -1,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfnmsub213ps,       INS_vfnmsub213pd},      HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_EmbBroadcastCompatible|HW_Flag_EmbMaskingCompatible)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplySubtractNegatedScalar,              16,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfnmsub213ss,       INS_vfnmsub213sd},      HW_Category_SIMDScalar,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_CopyUpperBits)
-HARDWARE_INTRINSIC(AVX10v1,         MultiplySubtractScalar,                     16,              3,      true,  {INS_invalid,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_vfmsub213ss,        INS_vfmsub213sd},       HW_Category_SIMDScalar,             HW_Flag_SpecialCodeGen|HW_Flag_FmaIntrinsic|HW_Flag_RmwIntrinsic|HW_Flag_CopyUpperBits)
 HARDWARE_INTRINSIC(AVX10v1,         PermuteVar16x16,                            32,              2,     false,  {INS_invalid,           INS_invalid,            INS_vpermw,             INS_vpermw,             INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_SpecialImport|HW_Flag_EmbMaskingCompatible)
 HARDWARE_INTRINSIC(AVX10v1,         PermuteVar16x16x2,                          32,              3,     false,  {INS_invalid,           INS_invalid,            INS_vpermt2w,           INS_vpermt2w,           INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_SpecialCodeGen|HW_Flag_PermuteVar2x|HW_Flag_RmwIntrinsic|HW_Flag_EmbMaskingCompatible)
 HARDWARE_INTRINSIC(AVX10v1,         PermuteVar16x8,                             16,              2,     false,  {INS_vpermb,            INS_vpermb,             INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid,            INS_invalid},           HW_Category_SimpleSIMD,             HW_Flag_SpecialImport|HW_Flag_EmbMaskingCompatible)
 
@@ -970,8 +970,8 @@ GenTree* Compiler::impNonConstFallback(NamedIntrinsic intrinsic, var_types simdT
             static_assert_no_msg(NI_AVX512F_RotateLeftVariable == (NI_AVX512F_RotateLeft + 1));
             static_assert_no_msg(NI_AVX512F_RotateRightVariable == (NI_AVX512F_RotateRight + 1));
             static_assert_no_msg(NI_AVX512F_VL_RotateLeftVariable == (NI_AVX512F_VL_RotateLeft + 1));
-            static_assert_no_msg(NI_AVX10v1_RotateLeftVariable == (NI_AVX10v1_RotateLeft + 1));
             static_assert_no_msg(NI_AVX512F_VL_RotateRightVariable == (NI_AVX512F_VL_RotateRight + 1));
+            static_assert_no_msg(NI_AVX10v1_RotateLeftVariable == (NI_AVX10v1_RotateLeft + 1));
             static_assert_no_msg(NI_AVX10v1_RotateRightVariable == (NI_AVX10v1_RotateRight + 1));
 
             impSpillSideEffect(true,
 
@@ -4012,11 +4012,8 @@ GenTree* Compiler::impIntrinsic(GenTree*                newobjThis,
                     op2 = gtNewSimdCreateScalarUnsafeNode(TYP_SIMD16, op2, callJitType, 16);
                     op1 = gtNewSimdCreateScalarUnsafeNode(TYP_SIMD16, op1, callJitType, 16);
 
-                    retNode = compOpportunisticallyDependsOn(InstructionSet_AVX10v1)
-                                  ? gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_AVX10v1_MultiplyAddScalar,
-                                                             callJitType, 16)
-                                  : gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_FMA_MultiplyAddScalar,
-                                                             callJitType, 16);
+                    retNode =
+                        gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_FMA_MultiplyAddScalar, callJitType, 16);
 
                     retNode = gtNewSimdToScalarNode(callType, retNode, callJitType, 16);
                     break;
@@ -9298,8 +9295,9 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,
 #if defined(FEATURE_HW_INTRINSICS) && defined(TARGET_XARCH)
         if (!isMagnitude && compOpportunisticallyDependsOn(InstructionSet_SSE2))
         {
-            bool needsFixup = false;
-            bool canHandle  = false;
+            bool needsFixup      = false;
+            bool canHandle       = false;
+            bool isV512Supported = false;
 
             if (isMax)
             {
@@ -9328,7 +9326,7 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,
                     needsFixup = cnsNode->IsFloatPositiveZero();
                 }
 
-                if (!needsFixup || compOpportunisticallyDependsOn(InstructionSet_AVX512F))
+                if (!needsFixup || compIsEvexOpportunisticallySupported(isV512Supported))
                 {
                     // Given the checks, op1 can safely be the cns and op2 the other node
 
@@ -9369,7 +9367,7 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,
                     needsFixup = cnsNode->IsFloatNegativeZero();
                 }
 
-                if (!needsFixup || compOpportunisticallyDependsOn(InstructionSet_AVX512F))
+                if (!needsFixup || compIsEvexOpportunisticallySupported(isV512Supported))
                 {
                     // Given the checks, op1 can safely be the cns and op2 the other node
 
@@ -9453,8 +9451,10 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,
                         tbl->gtSimdVal.i32[0] = 0x0700;
                     }
 
+                    NamedIntrinsic fixupScalarId = isV512Supported ? NI_AVX512F_FixupScalar : NI_AVX10v1_FixupScalar;
+
                     retNode = gtNewSimdHWIntrinsicNode(TYP_SIMD16, retNode, op2Clone, tbl, gtNewIconNode(0),
-                                                       NI_AVX512F_FixupScalar, callJitType, 16);
+                                                       fixupScalarId, callJitType, 16);
                 }
 
                 if (isNumber)
 
@@ -1303,30 +1303,29 @@ void Lowering::LowerHWIntrinsicCC(GenTreeHWIntrinsic* node, NamedIntrinsic newIn
 }
 
 //----------------------------------------------------------------------------------------------
-// LowerFusedMultiplyAdd: Changes NI_FMA_MultiplyAddScalar / NI_AVX10v1_MultiplyAddScalar produced
+// LowerFusedMultiplyAdd: Changes NI_FMA_MultiplyAddScalar produced
 //     by Math(F).FusedMultiplyAdd to a better FMA intrinsics if there are GT_NEG around in order
 //     to eliminate them.
 //
 //  Arguments:
 //     node - The hardware intrinsic node
 //
 //  Notes:
-//     Math(F).FusedMultiplyAdd is expanded into NI_FMA_MultiplyAddScalar / NI_AVX10v1_MultiplyAddScalar and
+//     Math(F).FusedMultiplyAdd is expanded into NI_FMA_MultiplyAddScalar and
 //     depending on additional GT_NEG nodes around it can be:
 //
-//      x *  y + z -> NI_FMA_MultiplyAddScalar / NI_AVX10v1_MultiplyAddScalar
-//      x * -y + z -> NI_FMA_MultiplyAddNegatedScalar / NI_AVX10v1_MultiplyAddNegatedScalar
-//     -x *  y + z -> NI_FMA_MultiplyAddNegatedScalar / NI_AVX10v1_MultiplyAddNegatedScalar
-//     -x * -y + z -> NI_FMA_MultiplyAddScalar / NI_AVX10v1_MultiplyAddScalar
-//      x *  y - z -> NI_FMA_MultiplySubtractScalar / NI_AVX10v1_MultiplySubtractScalar
-//      x * -y - z -> NI_FMA_MultiplySubtractNegatedScalar / NI_AVX10v1_MultiplySubtractNegatedScalar
-//     -x *  y - z -> NI_FMA_MultiplySubtractNegatedScalar / NI_AVX10v1_MultiplySubtractNegatedScalar
-//     -x * -y - z -> NI_FMA_MultiplySubtractScalar / NI_AVX10v1_MultiplySubtractScalar
+//      x *  y + z -> NI_FMA_MultiplyAddScalar
+//      x * -y + z -> NI_FMA_MultiplyAddNegatedScalar
+//     -x *  y + z -> NI_FMA_MultiplyAddNegatedScalar
+//     -x * -y + z -> NI_FMA_MultiplyAddScalar
+//      x *  y - z -> NI_FMA_MultiplySubtractScalar
+//      x * -y - z -> NI_FMA_MultiplySubtractNegatedScalar
+//     -x *  y - z -> NI_FMA_MultiplySubtractNegatedScalar
+//     -x * -y - z -> NI_FMA_MultiplySubtractScalar
 //
 void Lowering::LowerFusedMultiplyAdd(GenTreeHWIntrinsic* node)
 {
-    assert((node->GetHWIntrinsicId() == NI_FMA_MultiplyAddScalar) ||
-           (node->GetHWIntrinsicId() == NI_AVX10v1_MultiplyAddScalar));
+    assert(node->GetHWIntrinsicId() == NI_FMA_MultiplyAddScalar);
     GenTreeHWIntrinsic* createScalarOps[3];
 
     for (size_t i = 1; i <= 3; i++)
@@ -1370,26 +1369,11 @@ void Lowering::LowerFusedMultiplyAdd(GenTreeHWIntrinsic* node)
         createScalarOps[2]->Op(1)->ClearContained();
         ContainCheckHWIntrinsic(createScalarOps[2]);
 
-        if (comp->compOpportunisticallyDependsOn(InstructionSet_AVX10v1))
-        {
-            node->ChangeHWIntrinsicId(negMul ? NI_AVX10v1_MultiplySubtractNegatedScalar
-                                             : NI_AVX10v1_MultiplySubtractScalar);
-        }
-        else
-        {
-            node->ChangeHWIntrinsicId(negMul ? NI_FMA_MultiplySubtractNegatedScalar : NI_FMA_MultiplySubtractScalar);
-        }
+        node->ChangeHWIntrinsicId(negMul ? NI_FMA_MultiplySubtractNegatedScalar : NI_FMA_MultiplySubtractScalar);
     }
     else
     {
-        if (comp->compOpportunisticallyDependsOn(InstructionSet_AVX10v1))
-        {
-            node->ChangeHWIntrinsicId(negMul ? NI_AVX10v1_MultiplyAddNegatedScalar : NI_AVX10v1_MultiplyAddScalar);
-        }
-        else
-        {
-            node->ChangeHWIntrinsicId(negMul ? NI_FMA_MultiplyAddNegatedScalar : NI_FMA_MultiplyAddScalar);
-        }
+        node->ChangeHWIntrinsicId(negMul ? NI_FMA_MultiplyAddNegatedScalar : NI_FMA_MultiplyAddScalar);
     }
 }
 
@@ -2150,7 +2134,6 @@ GenTree* Lowering::LowerHWIntrinsic(GenTreeHWIntrinsic* node)
             break;
 
         case NI_FMA_MultiplyAddScalar:
-        case NI_AVX10v1_MultiplyAddScalar:
             LowerFusedMultiplyAdd(node);
             break;
 
@@ -4907,7 +4890,7 @@ GenTree* Lowering::LowerHWIntrinsicGetElement(GenTreeHWIntrinsic* node)
 
             NamedIntrinsic extractIntrinsicId = NI_AVX512F_ExtractVector128;
 
-            if ((genTypeSize(simdBaseType) == 8) && !comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
+            if ((genTypeSize(simdBaseType) == 8) && comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
             {
                 extractIntrinsicId = NI_AVX512DQ_ExtractVector128;
             }
@@ -5191,7 +5174,7 @@ GenTree* Lowering::LowerHWIntrinsicWithElement(GenTreeHWIntrinsic* node)
 
             NamedIntrinsic extractIntrinsicId = NI_AVX512F_ExtractVector128;
 
-            if ((genTypeSize(simdBaseType) == 8) && !comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
+            if ((genTypeSize(simdBaseType) == 8) && comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
             {
                 extractIntrinsicId = NI_AVX512DQ_ExtractVector128;
             }
@@ -5211,7 +5194,7 @@ GenTree* Lowering::LowerHWIntrinsicWithElement(GenTreeHWIntrinsic* node)
 
         NamedIntrinsic insertIntrinsicId = NI_AVX512F_InsertVector128;
 
-        if ((genTypeSize(simdBaseType) == 8) && !comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
+        if ((genTypeSize(simdBaseType) == 8) && comp->compOpportunisticallyDependsOn(InstructionSet_AVX512DQ))
         {
             insertIntrinsicId = NI_AVX512DQ_InsertVector128;
         }
@@ -8708,9 +8691,9 @@ bool Lowering::IsContainableHWIntrinsicOp(GenTreeHWIntrinsic* parentNode, GenTre
                 case NI_AVX10v1_RotateRight:
                 case NI_AVX10v1_RoundScale:
                 case NI_AVX10v1_ShiftRightArithmetic:
+                case NI_AVX10v1_Shuffle2x128:
                 case NI_AVX10v1_SumAbsoluteDifferencesInBlock32:
                 case NI_AVX10v1_TernaryLogic:
-                case NI_AVX10v1_Shuffle2x128:
                 case NI_AVX10v1_V512_Range:
                 case NI_AVX10v1_V512_Reduce:
                 {
@@ -8847,6 +8830,7 @@ bool Lowering::IsContainableHWIntrinsicOp(GenTreeHWIntrinsic* parentNode, GenTre
                 case NI_AVX512F_RoundScaleScalar:
                 case NI_AVX512DQ_RangeScalar:
                 case NI_AVX512DQ_ReduceScalar:
+                case NI_AVX10v1_FixupScalar:
                 case NI_AVX10v1_GetMantissaScalar:
                 case NI_AVX10v1_RangeScalar:
                 case NI_AVX10v1_ReduceScalar:
@@ -8937,6 +8921,7 @@ bool Lowering::IsContainableHWIntrinsicOp(GenTreeHWIntrinsic* parentNode, GenTre
                 case NI_AVX512F_X64_ConvertScalarToVector128Single:
                 case NI_AVX10v1_X64_ConvertScalarToVector128Double:
                 case NI_AVX10v1_X64_ConvertScalarToVector128Single:
+                case NI_AVX10v1_ConvertScalarToVector128Double:
                 case NI_AVX10v1_ConvertScalarToVector128Single:
                 {
                     if (!varTypeIsIntegral(childNode->TypeGet()))
 
@@ -2455,16 +2455,6 @@ int LinearScan::BuildHWIntrinsic(GenTreeHWIntrinsic* intrinsicTree, int* pDstCou
             case NI_AVX10v1_FusedMultiplyAddScalar:
             case NI_AVX10v1_FusedMultiplySubtractNegatedScalar:
             case NI_AVX10v1_FusedMultiplySubtractScalar:
-            case NI_AVX10v1_MultiplyAdd:
-            case NI_AVX10v1_MultiplyAddNegated:
-            case NI_AVX10v1_MultiplyAddNegatedScalar:
-            case NI_AVX10v1_MultiplyAddScalar:
-            case NI_AVX10v1_MultiplyAddSubtract:
-            case NI_AVX10v1_MultiplySubtract:
-            case NI_AVX10v1_MultiplySubtractAdd:
-            case NI_AVX10v1_MultiplySubtractNegated:
-            case NI_AVX10v1_MultiplySubtractNegatedScalar:
-            case NI_AVX10v1_MultiplySubtractScalar:
             {
                 assert((numArgs == 3) || (intrinsicTree->OperIsEmbRoundingEnabled()));
                 assert(isRMW);
 
@@ -1030,7 +1030,7 @@ GenTree* Compiler::impSimdAsHWIntrinsicSpecial(NamedIntrinsic       intrinsic,
                     assert(sig->numArgs == 1);
                     assert(varTypeIsLong(simdBaseType));
                     NamedIntrinsic intrinsic = NI_Illegal;
-                    if (compOpportunisticallyDependsOn(InstructionSet_AVX10v1))
+                    if ((simdSize != 64) && compOpportunisticallyDependsOn(InstructionSet_AVX10v1))
                     {
                         if (simdSize == 32)
                         {
 
@@ -1369,12 +1369,12 @@ void EEJitManager::SetCpuInfo()
     }
 
     if (((cpuFeatures & XArchIntrinsicConstants_Avx512f) != 0) &&
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512f_vl) != 0)
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512bw) != 0)
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512bw_vl) != 0)
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512cd) != 0)
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512cd_vl) != 0)
-        ((cpuFeatures & XArchIntrinsicConstants_Avx512dq) != 0)
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512f_vl) != 0) &&
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512bw) != 0) &&
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512bw_vl) != 0) &&
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512cd) != 0) &&
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512cd_vl) != 0) &&
+        ((cpuFeatures & XArchIntrinsicConstants_Avx512dq) != 0) &&
         ((cpuFeatures & XArchIntrinsicConstants_Avx512dq_vl) != 0))
     {
         // While the AVX-512 ISAs can be individually lit-up, they really
 
@@ -1616,118 +1616,6 @@ internal Avx10v1() { }
         /// </summary>
         public static Vector256<ulong> Min(Vector256<ulong> left, Vector256<ulong> right) { throw new PlatformNotSupportedException(); }
 
-        /// <summary>
-        /// __m128 _mm_fmadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFMADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAdd(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFMADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAdd(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fmadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFMADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAdd(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fmadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFMADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAdd(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fnmadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFNMADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFNMADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAddNegated(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fnmadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFNMADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAddNegated(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fnmadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFNMADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFNMADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAddNegated(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fnmadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFNMADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFNMADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAddNegated(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fnmadd_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFNMADDSS xmm1,         xmm2, xmm3/m32
-        ///   VFNMADDSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplyAddNegatedScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fnmadd_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMADDSD xmm1,         xmm2, xmm3/m64
-        ///   VFNMADDSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplyAddNegatedScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fmadd_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDSS xmm1,         xmm2, xmm3/m32
-        ///   VFMADDSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplyAddScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmadd_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDSD xmm1,         xmm2, xmm3/m64
-        ///   VFMADDSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplyAddScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fmaddsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFMADDSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAddSubtract(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmaddsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFMADDSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAddSubtract(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fmaddsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMADDSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFMADDSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAddSubtract(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fmaddsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMADDSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFMADDSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAddSubtract(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
         /// <summary>
         /// __m128i _mm_mullo_epi64 (__m128i a, __m128i b)
         ///   VPMULLQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
@@ -1764,118 +1652,6 @@ internal Avx10v1() { }
         /// </summary>
         public static Vector128<float> MultiplyScalar(Vector128<float> left, Vector128<float> right, [ConstantExpected(Max = FloatRoundingMode.ToZero)] FloatRoundingMode mode) { throw new PlatformNotSupportedException(); }
 
-        /// <summary>
-        /// __m128 _mm_fmsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtract(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtract(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fmsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtract(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fmsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtract(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fmsubadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtractAdd(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmsubadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtractAdd(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fmsubadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMSUBADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtractAdd(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fmsubadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMSUBADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtractAdd(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fnmsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFNMSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFNMSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtractNegated(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fnmsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFNMSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtractNegated(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256 _mm256_fnmsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFNMSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFNMSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtractNegated(Vector256<float> a, Vector256<float> b, Vector256<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m256d _mm256_fnmsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFNMSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFNMSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtractNegated(Vector256<double> a, Vector256<double> b, Vector256<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fnmsub_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFNMSUBSS xmm1,         xmm2, xmm3/m32
-        ///   VFNMSUBSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplySubtractNegatedScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fnmsub_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMSUBSD xmm1,         xmm2, xmm3/m64
-        ///   VFNMSUBSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplySubtractNegatedScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128d _mm_fmsub_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBSD xmm1,         xmm2, xmm3/m64
-        ///   VFMSUBSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplySubtractScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) { throw new PlatformNotSupportedException(); }
-
-        /// <summary>
-        /// __m128 _mm_fmsub_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBSS xmm1,         xmm2, xmm3/m32
-        ///   VFMSUBSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplySubtractScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) { throw new PlatformNotSupportedException(); }
-
         /// <summary>
         /// __m256i _mm256_permutevar16x16_epi16 (__m256i a, __m256i b)
         ///   VPERMW ymm1 {k1}{z}, ymm2, ymm3/m256
 
@@ -1615,118 +1615,6 @@ internal Avx10v1() { }
         /// </summary>
         public static Vector256<ulong> Min(Vector256<ulong> left, Vector256<ulong> right) => Min(left, right);
 
-        /// <summary>
-        /// __m128 _mm_fmadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFMADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAdd(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplyAdd(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFMADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAdd(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplyAdd(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fmadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFMADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAdd(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplyAdd(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fmadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFMADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAdd(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplyAdd(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fnmadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFNMADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFNMADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAddNegated(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplyAddNegated(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fnmadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFNMADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAddNegated(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplyAddNegated(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fnmadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFNMADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFNMADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAddNegated(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplyAddNegated(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fnmadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFNMADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFNMADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAddNegated(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplyAddNegated(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fnmadd_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFNMADDSS xmm1,         xmm2, xmm3/m32
-        ///   VFNMADDSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplyAddNegatedScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplyAddNegatedScalar(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fnmadd_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMADDSD xmm1,         xmm2, xmm3/m64
-        ///   VFNMADDSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplyAddNegatedScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplyAddNegatedScalar(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fmadd_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDSS xmm1,         xmm2, xmm3/m32
-        ///   VFMADDSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplyAddScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplyAddScalar(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmadd_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDSD xmm1,         xmm2, xmm3/m64
-        ///   VFMADDSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplyAddScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplyAddScalar(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fmaddsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMADDSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFMADDSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplyAddSubtract(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplyAddSubtract(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmaddsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMADDSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFMADDSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplyAddSubtract(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplyAddSubtract(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fmaddsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMADDSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFMADDSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplyAddSubtract(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplyAddSubtract(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fmaddsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMADDSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFMADDSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<double> MultiplyAddSubtract(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplyAddSubtract(a, b, c);
-
         /// <summary>
         /// __m128i _mm_mullo_epi64 (__m128i a, __m128i b)
         ///   VPMULLQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
@@ -1763,118 +1651,6 @@ internal Avx10v1() { }
         /// </summary>
         public static Vector128<float> MultiplyScalar(Vector128<float> left, Vector128<float> right, [ConstantExpected(Max = FloatRoundingMode.ToZero)] FloatRoundingMode mode) => MultiplyScalar(left, right, mode);
 
-        /// <summary>
-        /// __m128 _mm_fmsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtract(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplySubtract(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtract(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplySubtract(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fmsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtract(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplySubtract(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fmsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtract(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplySubtract(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fmsubadd_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBADDPS xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtractAdd(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplySubtractAdd(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmsubadd_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBADDPD xmm1,         xmm2, xmm3/m128
-        ///   VFMSUBADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtractAdd(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplySubtractAdd(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fmsubadd_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFMSUBADDPS ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtractAdd(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplySubtractAdd(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fmsubadd_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFMSUBADDPD ymm1,         ymm2, ymm3/m256
-        ///   VFMSUBADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtractAdd(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplySubtractAdd(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fnmsub_ps (__m128 a, __m128 b, __m128 c)
-        ///   VFNMSUBPS xmm1,         xmm2, xmm3/m128
-        ///   VFNMSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst
-        /// </summary>
-        public static Vector128<float> MultiplySubtractNegated(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplySubtractNegated(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fnmsub_pd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMSUBPD xmm1,         xmm2, xmm3/m128
-        ///   VFNMSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst
-        /// </summary>
-        public static Vector128<double> MultiplySubtractNegated(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplySubtractNegated(a, b, c);
-
-        /// <summary>
-        /// __m256 _mm256_fnmsub_ps (__m256 a, __m256 b, __m256 c)
-        ///   VFNMSUBPS ymm1,         ymm2, ymm3/m256
-        ///   VFNMSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst
-        /// </summary>
-        public static Vector256<float> MultiplySubtractNegated(Vector256<float> a, Vector256<float> b, Vector256<float> c) => MultiplySubtractNegated(a, b, c);
-
-        /// <summary>
-        /// __m256d _mm256_fnmsub_pd (__m256d a, __m256d b, __m256d c)
-        ///   VFNMSUBPD ymm1,         ymm2, ymm3/m256
-        ///   VFNMSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst
-        /// </summary>
-        public static Vector256<double> MultiplySubtractNegated(Vector256<double> a, Vector256<double> b, Vector256<double> c) => MultiplySubtractNegated(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fnmsub_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFNMSUBSS xmm1,         xmm2, xmm3/m32
-        ///   VFNMSUBSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplySubtractNegatedScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplySubtractNegatedScalar(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fnmsub_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFNMSUBSD xmm1,         xmm2, xmm3/m64
-        ///   VFNMSUBSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplySubtractNegatedScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplySubtractNegatedScalar(a, b, c);
-
-        /// <summary>
-        /// __m128d _mm_fmsub_sd (__m128d a, __m128d b, __m128d c)
-        ///   VFMSUBSD xmm1,         xmm2, xmm3/m64
-        ///   VFMSUBSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}
-        /// </summary>
-        public static Vector128<double> MultiplySubtractScalar(Vector128<double> a, Vector128<double> b, Vector128<double> c) => MultiplySubtractScalar(a, b, c);
-
-        /// <summary>
-        /// __m128 _mm_fmsub_ss (__m128 a, __m128 b, __m128 c)
-        ///   VFMSUBSS xmm1,         xmm2, xmm3/m32
-        ///   VFMSUBSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}
-        /// </summary>
-        public static Vector128<float> MultiplySubtractScalar(Vector128<float> a, Vector128<float> b, Vector128<float> c) => MultiplySubtractScalar(a, b, c);
-
         /// <summary>
         /// __m256i _mm256_permutevar16x16_epi16 (__m256i a, __m256i b)
         ///   VPERMW ymm1 {k1}{z}, ymm2, ymm3/m256
Original file line number	Diff line number	Diff line change
`@@ -4012,11 +4012,8 @@ GenTree* Compiler::impIntrinsic(GenTree* newobjThis,`
`4012`	`4012`	`op2 = gtNewSimdCreateScalarUnsafeNode(TYP_SIMD16, op2, callJitType, 16);`
`4013`	`4013`	`op1 = gtNewSimdCreateScalarUnsafeNode(TYP_SIMD16, op1, callJitType, 16);`
`4014`	`4014`
`4015`		`- retNode = compOpportunisticallyDependsOn(InstructionSet_AVX10v1)`
`4016`		`- ? gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_AVX10v1_MultiplyAddScalar,`
`4017`		`- callJitType, 16)`
`4018`		`- : gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_FMA_MultiplyAddScalar,`
`4019`		`- callJitType, 16);`
	`4015`	`+ retNode =`
	`4016`	`+ gtNewSimdHWIntrinsicNode(TYP_SIMD16, op1, op2, op3, NI_FMA_MultiplyAddScalar, callJitType, 16);`
`4020`	`4017`
`4021`	`4018`	`retNode = gtNewSimdToScalarNode(callType, retNode, callJitType, 16);`
`4022`	`4019`	`break;`
`@@ -9298,8 +9295,9 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,`
`9298`	`9295`	`#if defined(FEATURE_HW_INTRINSICS) && defined(TARGET_XARCH)`
`9299`	`9296`	`if (!isMagnitude && compOpportunisticallyDependsOn(InstructionSet_SSE2))`
`9300`	`9297`	`{`
`9301`		`- bool needsFixup = false;`
`9302`		`- bool canHandle = false;`
	`9298`	`+ bool needsFixup = false;`
	`9299`	`+ bool canHandle = false;`
	`9300`	`+ bool isV512Supported = false;`
`9303`	`9301`
`9304`	`9302`	`if (isMax)`
`9305`	`9303`	`{`
`@@ -9328,7 +9326,7 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,`
`9328`	`9326`	`needsFixup = cnsNode->IsFloatPositiveZero();`
`9329`	`9327`	`}`
`9330`	`9328`
`9331`		`- if (!needsFixup \|\| compOpportunisticallyDependsOn(InstructionSet_AVX512F))`
	`9329`	`+ if (!needsFixup \|\| compIsEvexOpportunisticallySupported(isV512Supported))`
`9332`	`9330`	`{`
`9333`	`9331`	`// Given the checks, op1 can safely be the cns and op2 the other node`
`9334`	`9332`
`@@ -9369,7 +9367,7 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,`
`9369`	`9367`	`needsFixup = cnsNode->IsFloatNegativeZero();`
`9370`	`9368`	`}`
`9371`	`9369`
`9372`		`- if (!needsFixup \|\| compOpportunisticallyDependsOn(InstructionSet_AVX512F))`
	`9370`	`+ if (!needsFixup \|\| compIsEvexOpportunisticallySupported(isV512Supported))`
`9373`	`9371`	`{`
`9374`	`9372`	`// Given the checks, op1 can safely be the cns and op2 the other node`
`9375`	`9373`
`@@ -9453,8 +9451,10 @@ GenTree* Compiler::impMinMaxIntrinsic(CORINFO_METHOD_HANDLE method,`
`9453`	`9451`	`tbl->gtSimdVal.i32[0] = 0x0700;`
`9454`	`9452`	`}`
`9455`	`9453`
	`9454`	`+ NamedIntrinsic fixupScalarId = isV512Supported ? NI_AVX512F_FixupScalar : NI_AVX10v1_FixupScalar;`
	`9455`	`+`
`9456`	`9456`	`retNode = gtNewSimdHWIntrinsicNode(TYP_SIMD16, retNode, op2Clone, tbl, gtNewIconNode(0),`
`9457`		`- NI_AVX512F_FixupScalar, callJitType, 16);`
	`9457`	`+ fixupScalarId, callJitType, 16);`
`9458`	`9458`	`}`
`9459`	`9459`
`9460`	`9460`	`if (isNumber)`
Original file line number	Diff line number	Diff line change
`@@ -1030,7 +1030,7 @@ GenTree* Compiler::impSimdAsHWIntrinsicSpecial(NamedIntrinsic intrinsic,`
`1030`	`1030`	`assert(sig->numArgs == 1);`
`1031`	`1031`	`assert(varTypeIsLong(simdBaseType));`
`1032`	`1032`	`NamedIntrinsic intrinsic = NI_Illegal;`
`1033`		`- if (compOpportunisticallyDependsOn(InstructionSet_AVX10v1))`
	`1033`	`+ if ((simdSize != 64) && compOpportunisticallyDependsOn(InstructionSet_AVX10v1))`
`1034`	`1034`	`{`
`1035`	`1035`	`if (simdSize == 32)`
`1036`	`1036`	`{`