diff --git a/main/acle.md b/main/acle.md
index 3b066e93..1d0d2065 100644
--- a/main/acle.md
+++ b/main/acle.md
@@ -465,6 +465,9 @@ Armv8.4-A [[ARMARMv84]](#ARMARMv84). Support is added for the Dot Product intrin
 
 * Added feature test macro for FEAT_SSVE_FEXPA.
 * Added feature test macro for FEAT_CSSC.
+* Added support for FEAT_FPRCVT intrinsics and `__ARM_FEATURE_FPRCVT`.
+* Added support for modal 8-bit floating point matrix multiply-accumulate widening intrinsics.
+* Added support for 16-bit floating point matrix multiply-accumulate widening intrinsics.
 
 ### References
 
@@ -2207,6 +2210,13 @@ ACLE intrinsics are available. This implies that `__ARM_FEATURE_SM4` and
 floating-point absolute minimum and maximum instructions (FEAT_FAMINMAX)
 and if the associated ACLE intrinsics are available.
 
+### FPRCVT extension
+
+`__ARM_FEATURE_FPRCVT` is defined to `1` if there is hardware
+support for floating-point to/from integer convertion instructions
+with only scalar SIMD&FP register operands and results having
+different input and output register sizes.
+
 ### Lookup table extensions
 
 `__ARM_FEATURE_LUT` is defined to 1 if there is hardware support for
@@ -2346,6 +2356,26 @@ is hardware support for the SVE forms of these instructions and if the
 associated ACLE intrinsics are available. This implies that
 `__ARM_FEATURE_MATMUL_INT8` and `__ARM_FEATURE_SVE` are both nonzero.
 
+##### Multiplication of modal 8-bit floating-point matrices
+
+This section is in
+[**Alpha** state](#current-status-and-anticipated-changes) and might change or be
+extended in the future.
+
+`__ARM_FEATURE_F8F16MM` is defined to `1` if there is hardware support
+for the NEON and SVE modal 8-bit floating-point matrix multiply-accumulate to half-precision (FEAT_F8F16MM)
+instructions and if the associated ACLE intrinsics are available.
+
+`__ARM_FEATURE_F8F32MM` is defined to `1` if there is hardware support
+for the NEON and SVE modal 8-bit floating-point matrix multiply-accumulate to single-precision (FEAT_F8F32MM)
+instructions and if the associated ACLE intrinsics are available.
+
+##### Multiplication of 16-bit floating-point matrices
+
+`__ARM_FEATURE_SVE_F16F32MM` is defined to `1` if there is hardware support
+for the SVE 16-bit floating-point to 32-bit floating-point matrix multiply and add
+(FEAT_SVE_F16F32MM) instructions and if the associated ACLE intrinsics are available.
+
 ##### Multiplication of 32-bit floating-point matrices
 
 `__ARM_FEATURE_SVE_MATMUL_FP32` is defined to `1` if there is hardware support
@@ -2590,6 +2620,7 @@ be found in [[BA]](#BA).
 | [`__ARM_FEATURE_FP8DOT2`](#modal-8-bit-floating-point-extensions)                                                                                       | Modal 8-bit floating-point extensions                                                              | 1           |
 | [`__ARM_FEATURE_FP8DOT4`](#modal-8-bit-floating-point-extensions)                                                                                       | Modal 8-bit floating-point extensions                                                              | 1           |
 | [`__ARM_FEATURE_FP8FMA`](#modal-8-bit-floating-point-extensions)                                                                                        | Modal 8-bit floating-point extensions                                                              | 1           |
+| [`__ARM_FEATURE_FPRCVT`](#fprcvt-extension)                                                                                                             | FPRCVT extension                                                                                   | 1           |
 | [`__ARM_FEATURE_FRINT`](#availability-of-armv8.5-a-floating-point-rounding-intrinsics)                                                                  | Floating-point rounding extension (Arm v8.5-A)                                                     | 1           |
 | [`__ARM_FEATURE_GCS`](#guarded-control-stack)                                                                                                           | Guarded Control Stack                                                                              | 1           |
 | [`__ARM_FEATURE_GCS_DEFAULT`](#guarded-control-stack)                                                                                                   | Guarded Control Stack protection can be enabled                                                    | 1           |
@@ -2637,6 +2668,9 @@ be found in [[BA]](#BA).
 | [`__ARM_FEATURE_SVE_BITS`](#scalable-vector-extension-sve)                                                                                              | The number of bits in an SVE vector, when known in advance                                         | 256         |
 | [`__ARM_FEATURE_SVE_MATMUL_FP32`](#multiplication-of-32-bit-floating-point-matrices)                                                                    | 32-bit floating-point matrix multiply extension (FEAT_F32MM)                                       | 1           |
 | [`__ARM_FEATURE_SVE_MATMUL_FP64`](#multiplication-of-64-bit-floating-point-matrices)                                                                    | 64-bit floating-point matrix multiply extension (FEAT_F64MM)                                       | 1           |
+| [`__ARM_FEATURE_F8F16MM`](#multiplication-of-modal-8-bit-floating-point-matrices)                                                                       | Modal 8-bit floating-point matrix multiply-accumulate to half-precision extension (FEAT_F8F16MM)   | 1           |
+| [`__ARM_FEATURE_F8F32MM`](#multiplication-of-modal-8-bit-floating-point-matrices)                                                                       | Modal 8-bit floating-point matrix multiply-accumulate to single-precision extension (FEAT_F8F32MM) | 1           |
+| [`__ARM_FEATURE_SVE_F16F32MM`](#multiplication-of-16-bit-floating-point-matrices)                                                                       | 16-bit floating-point matrix multiply-accumulate to single-precision extension (FEAT_SVE_F16F32MM) | 1           |
 | [`__ARM_FEATURE_SVE_MATMUL_INT8`](#multiplication-of-8-bit-integer-matrices)                                                                            | SVE support for the integer matrix multiply extension (FEAT_I8MM)                                  | 1           |
 | [`__ARM_FEATURE_SVE_PREDICATE_OPERATORS`](#scalable-vector-extension-sve)                                                                               | Level of support for C and C++ operators on SVE vector types                                        | 1           |
 | [`__ARM_FEATURE_SVE_VECTOR_OPERATORS`](#scalable-vector-extension-sve)                                                                                  | Level of support for C and C++ operators on SVE predicate types                                     | 1           |
@@ -9374,6 +9408,31 @@ BFloat16 floating-point multiply vectors.
                                   uint64_t imm_idx);
    ```
 
+### SVE2 floating-point matrix multiply-accumulate instructions.
+
+#### FMMLA (widening, FP8 to FP16)
+
+Modal 8-bit floating-point matrix multiply-accumulate to half-precision.
+```c
+  // Only if (__ARM_FEATURE_SVE2 && __ARM_FEATURE_F8F16MM)
+  svfloat16_t svmmla[_f16_mf8]_fpm(svfloat16_t zda, svmfloat8_t zn, svmfloat8_t zm, fpm_t fpm);
+```
+
+#### FMMLA (widening, FP8 to FP32)
+
+Modal 8-bit floating-point matrix multiply-accumulate to single-precision.
+```c
+  // Only if (__ARM_FEATURE_SVE2 && __ARM_FEATURE_F8F32MM)
+  svfloat32_t svmmla[_f32_mf8]_fpm(svfloat32_t zda, svmfloat8_t zn, svmfloat8_t zm, fpm_t fpm);
+```
+#### FMMLA (widening, FP16 to FP32)
+
+16-bit floating-point matrix multiply-accumulate to single-precision.
+```c
+  // Only if __ARM_FEATURE_SVE_F16F32MM
+  svfloat32_t svmmla[_f32_f16](svfloat32_t zda, svfloat16_t zn, svfloat16_t zm);
+```
+
 ### SVE2.1 instruction intrinsics
 
 The specification for SVE2.1 is in
diff --git a/neon_intrinsics/advsimd.md b/neon_intrinsics/advsimd.md
index a87ad725..f8e4e19b 100644
--- a/neon_intrinsics/advsimd.md
+++ b/neon_intrinsics/advsimd.md
@@ -12,7 +12,7 @@ toc: true
 ---
 
 <!--
-SPDX-FileCopyrightText: Copyright 2014-2024 Arm Limited and/or its affiliates <open-source-office@arm.com>
+SPDX-FileCopyrightText: Copyright 2014-2025 Arm Limited and/or its affiliates <open-source-office@arm.com>
 SPDX-FileCopyrightText: Copyright 2021 Matt P. Dziubinski <matdzb@gmail.com>
 CC-BY-SA-4.0 AND Apache-Patent-License
 See LICENSE.md file for details
@@ -107,7 +107,7 @@ for more information about Arm’s trademarks.
 
 ## Copyright
 
-* Copyright 2014-2024 Arm Limited and/or its affiliates <open-source-office@arm.com>
+* Copyright 2014-2025 Arm Limited and/or its affiliates <open-source-office@arm.com>
 * Copyright 2021 Matt P. Dziubinski <matdzb@gmail.com>
 
 ## Document history
@@ -162,6 +162,13 @@ for more information about Arm’s trademarks.
 
 * Added `fp8` version of the `vget_lane` intrinsic.
 
+### Changes between 2025Q2 and 2025Q3
+
+* Added support for FEAT_FPRCVT intrinsics.
+* Fixed typos in the "AArch64 Instruction" and "Result" fields of
+  floating point conversion intrinsics from "Half Precision to 32-bit"
+  and "Half Precision to 64-bit".
+
 <!---
 **** Do not remove! ****
 The line following this comment is necessary to generate custom geometry settings
@@ -2055,15 +2062,25 @@ The intrinsics in this section are guarded by the macro ``__ARM_NEON``.
 | <code>uint32x2_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvta_u32_f32" target="_blank">vcvta_u32_f32</a>(float32x2_t a)</code>                                                                                    | `a -> Vn.2S`                   | `FCVTAU Vd.2S,Vn.2S`    | `Vd.2S -> result` | `A32/A64`                 |
 | <code>uint32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtaq_u32_f32" target="_blank">vcvtaq_u32_f32</a>(float32x4_t a)</code>                                                                                  | `a -> Vn.4S`                   | `FCVTAU Vd.4S,Vn.4S`    | `Vd.4S -> result` | `A32/A64`                 |
 | <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvts_s32_f32" target="_blank">vcvts_s32_f32</a>(float32_t a)</code>                                                                                         | `a -> Sn`                      | `FCVTZS Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvts_s64_f32" target="_blank">vcvts_s64_f32</a>(float32_t a)</code>                                                                                         | `a -> Sn`                      | `FCVTZS Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvts_u32_f32" target="_blank">vcvts_u32_f32</a>(float32_t a)</code>                                                                                        | `a -> Sn`                      | `FCVTZU Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvts_u64_f32" target="_blank">vcvts_u64_f32</a>(float32_t a)</code>                                                                                        | `a -> Sn`                      | `FCVTZU Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtns_s32_f32" target="_blank">vcvtns_s32_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTNS Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtns_s64_f32" target="_blank">vcvtns_s64_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTNS Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtns_u32_f32" target="_blank">vcvtns_u32_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTNU Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtns_u64_f32" target="_blank">vcvtns_u64_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTNU Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtms_s32_f32" target="_blank">vcvtms_s32_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTMS Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtms_s64_f32" target="_blank">vcvtms_s64_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTMS Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtms_u32_f32" target="_blank">vcvtms_u32_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTMU Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtms_u64_f32" target="_blank">vcvtms_u64_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTMU Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtps_s32_f32" target="_blank">vcvtps_s32_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTPS Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtps_s64_f32" target="_blank">vcvtps_s64_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTPS Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtps_u32_f32" target="_blank">vcvtps_u32_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTPU Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtps_u64_f32" target="_blank">vcvtps_u64_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTPU Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtas_s32_f32" target="_blank">vcvtas_s32_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTAS Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtas_s64_f32" target="_blank">vcvtas_s64_f32</a>(float32_t a)</code>                                                                                       | `a -> Sn`                      | `FCVTAS Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtas_u32_f32" target="_blank">vcvtas_u32_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTAU Sd,Sn`          | `Sd -> result`    | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtas_u64_f32" target="_blank">vcvtas_u64_f32</a>(float32_t a)</code>                                                                                      | `a -> Sn`                      | `FCVTAU Dd,Sn`          | `Dd -> result`    | `A64`                     |
 | <code>int64x1_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvt_s64_f64" target="_blank">vcvt_s64_f64</a>(float64x1_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTZS Dd,Dn`          | `Dd -> result`    | `A64`                     |
 | <code>int64x2_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtq_s64_f64" target="_blank">vcvtq_s64_f64</a>(float64x2_t a)</code>                                                                                     | `a -> Vn.2D`                   | `FCVTZS Vd.2D,Vn.2D`    | `Vd.2D -> result` | `A64`                     |
 | <code>uint64x1_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvt_u64_f64" target="_blank">vcvt_u64_f64</a>(float64x1_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTZU Dd,Dn`          | `Dd -> result`    | `A64`                     |
@@ -2084,15 +2101,25 @@ The intrinsics in this section are guarded by the macro ``__ARM_NEON``.
 | <code>int64x2_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtaq_s64_f64" target="_blank">vcvtaq_s64_f64</a>(float64x2_t a)</code>                                                                                   | `a -> Vn.2D`                   | `FCVTAS Vd.2D,Vn.2D`    | `Vd.2D -> result` | `A64`                     |
 | <code>uint64x1_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvta_u64_f64" target="_blank">vcvta_u64_f64</a>(float64x1_t a)</code>                                                                                    | `a -> Dn`                      | `FCVTAU Dd,Dn`          | `Dd -> result`    | `A64`                     |
 | <code>uint64x2_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtaq_u64_f64" target="_blank">vcvtaq_u64_f64</a>(float64x2_t a)</code>                                                                                  | `a -> Vn.2D`                   | `FCVTAU Vd.2D,Vn.2D`    | `Vd.2D -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtd_s32_f64" target="_blank">vcvtd_s32_f64</a>(float64_t a)</code>                                                                                         | `a -> Dn`                      | `FCVTZS Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtd_s64_f64" target="_blank">vcvtd_s64_f64</a>(float64_t a)</code>                                                                                         | `a -> Dn`                      | `FCVTZS Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtd_u32_f64" target="_blank">vcvtd_u32_f64</a>(float64_t a)</code>                                                                                        | `a -> Dn`                      | `FCVTZU Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtd_u64_f64" target="_blank">vcvtd_u64_f64</a>(float64_t a)</code>                                                                                        | `a -> Dn`                      | `FCVTZU Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnd_s32_f64" target="_blank">vcvtnd_s32_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTNS Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnd_s64_f64" target="_blank">vcvtnd_s64_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTNS Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnd_u32_f64" target="_blank">vcvtnd_u32_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTNU Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnd_u64_f64" target="_blank">vcvtnd_u64_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTNU Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmd_s32_f64" target="_blank">vcvtmd_s32_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTMS Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmd_s64_f64" target="_blank">vcvtmd_s64_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTMS Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmd_u32_f64" target="_blank">vcvtmd_u32_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTMU Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmd_u64_f64" target="_blank">vcvtmd_u64_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTMU Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtpd_s32_f64" target="_blank">vcvtpd_s32_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTPS Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtpd_s64_f64" target="_blank">vcvtpd_s64_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTPS Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtpd_u32_f64" target="_blank">vcvtpd_u32_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTPU Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtpd_u64_f64" target="_blank">vcvtpd_u64_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTPU Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtad_s32_f64" target="_blank">vcvtad_s32_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTAS Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtad_s64_f64" target="_blank">vcvtad_s64_f64</a>(float64_t a)</code>                                                                                       | `a -> Dn`                      | `FCVTAS Dd,Dn`          | `Dd -> result`    | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtad_u32_f64" target="_blank">vcvtad_u32_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTAU Sd,Dn`          | `Sd -> result`    | `A64`                     |
 | <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtad_u64_f64" target="_blank">vcvtad_u64_f64</a>(float64_t a)</code>                                                                                      | `a -> Dn`                      | `FCVTAU Dd,Dn`          | `Dd -> result`    | `A64`                     |
 | <code>int32x2_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvt_n_s32_f32" target="_blank">vcvt_n_s32_f32</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x2_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int n)</code>             | `a -> Vn.2S`<br>`1 <= n <= 32` | `FCVTZS Vd.2S,Vn.2S,#n` | `Vd.2S -> result` | `v7/A32/A64`              |
 | <code>int32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtq_n_s32_f32" target="_blank">vcvtq_n_s32_f32</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x4_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int n)</code>           | `a -> Vn.4S`<br>`1 <= n <= 32` | `FCVTZS Vd.4S,Vn.4S,#n` | `Vd.4S -> result` | `v7/A32/A64`              |
@@ -5109,35 +5136,35 @@ The intrinsics in this section are guarded by the macro ``__ARM_NEON``.
 | <code>float16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_f16_u32" target="_blank">vcvth_f16_u32</a>(uint32_t a)</code>                                                                           | `a -> Hn`                   | `UCVTF Hd,Hn`         | `Hd -> result` | `A32/A64`                 |
 | <code>float16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_f16_u64" target="_blank">vcvth_f16_u64</a>(uint64_t a)</code>                                                                           | `a -> Hn`                   | `UCVTF Hd,Hn`         | `Hd -> result` | `A64`                     |
 | <code>int16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_s16_f16" target="_blank">vcvth_s16_f16</a>(float16_t a)</code>                                                                            | `a -> Hn`                   | `FCVTZS Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_s32_f16" target="_blank">vcvth_s32_f16</a>(float16_t a)</code>                                                                            | `a -> Hn`                   | `FCVTZS Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_s64_f16" target="_blank">vcvth_s64_f16</a>(float16_t a)</code>                                                                            | `a -> Hn`                   | `FCVTZS Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_s32_f16" target="_blank">vcvth_s32_f16</a>(float16_t a)</code>                                                                            | `a -> Hn`                   | `FCVTZS Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_s64_f16" target="_blank">vcvth_s64_f16</a>(float16_t a)</code>                                                                            | `a -> Hn`                   | `FCVTZS Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>uint16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_u16_f16" target="_blank">vcvth_u16_f16</a>(float16_t a)</code>                                                                           | `a -> Hn`                   | `FCVTZU Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_u32_f16" target="_blank">vcvth_u32_f16</a>(float16_t a)</code>                                                                           | `a -> Hn`                   | `FCVTZU Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_u64_f16" target="_blank">vcvth_u64_f16</a>(float16_t a)</code>                                                                           | `a -> Hn`                   | `FCVTZU Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_u32_f16" target="_blank">vcvth_u32_f16</a>(float16_t a)</code>                                                                           | `a -> Hn`                   | `FCVTZU Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_u64_f16" target="_blank">vcvth_u64_f16</a>(float16_t a)</code>                                                                           | `a -> Hn`                   | `FCVTZU Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>int16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_s16_f16" target="_blank">vcvtah_s16_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTAS Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_s32_f16" target="_blank">vcvtah_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTAS Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_s64_f16" target="_blank">vcvtah_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTAS Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_s32_f16" target="_blank">vcvtah_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTAS Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_s64_f16" target="_blank">vcvtah_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTAS Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>uint16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_u16_f16" target="_blank">vcvtah_u16_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTAU Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_u32_f16" target="_blank">vcvtah_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTAU Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_u64_f16" target="_blank">vcvtah_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTAU Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_u32_f16" target="_blank">vcvtah_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTAU Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtah_u64_f16" target="_blank">vcvtah_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTAU Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>int16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_s16_f16" target="_blank">vcvtmh_s16_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTMS Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_s32_f16" target="_blank">vcvtmh_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTMS Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_s64_f16" target="_blank">vcvtmh_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTMS Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_s32_f16" target="_blank">vcvtmh_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTMS Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_s64_f16" target="_blank">vcvtmh_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTMS Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>uint16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_u16_f16" target="_blank">vcvtmh_u16_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTMU Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_u32_f16" target="_blank">vcvtmh_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTMU Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_u64_f16" target="_blank">vcvtmh_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTMU Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_u32_f16" target="_blank">vcvtmh_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTMU Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtmh_u64_f16" target="_blank">vcvtmh_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTMU Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>int16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_s16_f16" target="_blank">vcvtnh_s16_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTNS Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_s32_f16" target="_blank">vcvtnh_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTNS Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_s64_f16" target="_blank">vcvtnh_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTNS Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_s32_f16" target="_blank">vcvtnh_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTNS Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_s64_f16" target="_blank">vcvtnh_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTNS Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>uint16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_u16_f16" target="_blank">vcvtnh_u16_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTNU Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_u32_f16" target="_blank">vcvtnh_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTNU Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_u64_f16" target="_blank">vcvtnh_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTNU Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_u32_f16" target="_blank">vcvtnh_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTNU Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtnh_u64_f16" target="_blank">vcvtnh_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTNU Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>int16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_s16_f16" target="_blank">vcvtph_s16_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTPS Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_s32_f16" target="_blank">vcvtph_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTPS Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_s64_f16" target="_blank">vcvtph_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTPS Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>int32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_s32_f16" target="_blank">vcvtph_s32_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTPS Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>int64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_s64_f16" target="_blank">vcvtph_s64_f16</a>(float16_t a)</code>                                                                          | `a -> Hn`                   | `FCVTPS Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>uint16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_u16_f16" target="_blank">vcvtph_u16_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTPU Hd,Hn`        | `Hd -> result` | `A64`                     |
-| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_u32_f16" target="_blank">vcvtph_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTPU Hd,Hn`        | `Hd -> result` | `A32/A64`                 |
-| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_u64_f16" target="_blank">vcvtph_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTPU Hd,Hn`        | `Hd -> result` | `A64`                     |
+| <code>uint32_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_u32_f16" target="_blank">vcvtph_u32_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTPU Sd,Hn`        | `Sd -> result` | `A64`                     |
+| <code>uint64_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvtph_u64_f16" target="_blank">vcvtph_u64_f16</a>(float16_t a)</code>                                                                         | `a -> Hn`                   | `FCVTPU Dd,Hn`        | `Dd -> result` | `A64`                     |
 | <code>float16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_n_f16_s16" target="_blank">vcvth_n_f16_s16</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; int16_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int n)</code>  | `a -> Hn`<br>`1 <= n <= 16` | `SCVTF Hd,Hn,#n`      | `Hd -> result` | `A64`                     |
 | <code>float16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_n_f16_s32" target="_blank">vcvth_n_f16_s32</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; int32_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int n)</code>  | `a -> Hn`<br>`1 <= n <= 16` | `SCVTF Hd,Hn,#n`      | `Hd -> result` | `A32/A64`                 |
 | <code>float16_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vcvth_n_f16_s64" target="_blank">vcvth_n_f16_s64</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; int64_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int n)</code>  | `a -> Hn`<br>`1 <= n <= 16` | `SCVTF Hd,Hn,#n`      | `Hd -> result` | `A64`                     |
@@ -6175,3 +6202,14 @@ The intrinsics in this section are guarded by the macro ``__ARM_NEON``.
 | <code>float32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vmlalltbq_laneq_f32_mf8_fpm" target="_blank">vmlalltbq_laneq_f32_mf8_fpm</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x4_t vd,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t vn,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t vm,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int lane,<br>&nbsp;&nbsp;&nbsp;&nbsp; fpm_t fpm)</code> | `vd -> Vd.4S`<br>`vm -> Vn.16B`<br>`vm -> Vm.B`<br>`0 <= lane <= 15` | `FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]` | `Vd.4S -> result` | `A64`                     |
 | <code>float32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vmlallttq_lane_f32_mf8_fpm" target="_blank">vmlallttq_lane_f32_mf8_fpm</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x4_t vd,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t vn,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x8_t vm,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int lane,<br>&nbsp;&nbsp;&nbsp;&nbsp; fpm_t fpm)</code>    | `vd -> Vd.4S`<br>`vm -> Vn.16B`<br>`vm -> Vm.B`<br>`0 <= lane <= 7`  | `FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]` | `Vd.4S -> result` | `A64`                     |
 | <code>float32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vmlallttq_laneq_f32_mf8_fpm" target="_blank">vmlallttq_laneq_f32_mf8_fpm</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x4_t vd,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t vn,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t vm,<br>&nbsp;&nbsp;&nbsp;&nbsp; const int lane,<br>&nbsp;&nbsp;&nbsp;&nbsp; fpm_t fpm)</code> | `vd -> Vd.4S`<br>`vm -> Vn.16B`<br>`vm -> Vm.B`<br>`0 <= lane <= 15` | `FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]` | `Vd.4S -> result` | `A64`                     |
+
+## Matrix multiplication intrinsics from Armv9.6-A
+
+### Vector arithmetic
+
+#### Matrix multiply
+
+| Intrinsic                                                                                                                                                                                                                                                                                    | Argument preparation                           | AArch64 Instruction           | Result            | Supported architectures   |
+|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------|-------------------------------|-------------------|---------------------------|
+| <code>float16x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vmmlaq_f16_mf8" target="_blank">vmmlaq_f16_mf8</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float16x4_t r,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t b)</code> | `r -> Vd.4H`<br>`a -> Vn.16B`<br>`b -> Vm.16B` | `FMMLA Vd.4H, Vn.16B, Vm.16B` | `Vd.4H -> result` | `A64`                     |
+| <code>float32x4_t <a href="https://developer.arm.com/architectures/instruction-sets/intrinsics/vmmlaq_f32_mf8" target="_blank">vmmlaq_f32_mf8</a>(<br>&nbsp;&nbsp;&nbsp;&nbsp; float32x4_t r,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t a,<br>&nbsp;&nbsp;&nbsp;&nbsp; mfloat8x16_t b)</code> | `r -> Vd.4S`<br>`a -> Vn.16B`<br>`b -> Vm.16B` | `FMMLA Vd.4S, Vn.16B, Vm.16B` | `Vd.4S -> result` | `A64`                     |
diff --git a/neon_intrinsics/advsimd.template.md b/neon_intrinsics/advsimd.template.md
index 80d1ce7a..336378db 100644
--- a/neon_intrinsics/advsimd.template.md
+++ b/neon_intrinsics/advsimd.template.md
@@ -12,7 +12,7 @@ toc: true
 ---
 
 <!--
-SPDX-FileCopyrightText: Copyright 2014-2024 Arm Limited and/or its affiliates <open-source-office@arm.com>
+SPDX-FileCopyrightText: Copyright 2014-2025 Arm Limited and/or its affiliates <open-source-office@arm.com>
 SPDX-FileCopyrightText: Copyright 2021 Matt P. Dziubinski <matdzb@gmail.com>
 CC-BY-SA-4.0 AND Apache-Patent-License
 See LICENSE.md file for details
@@ -107,7 +107,7 @@ for more information about Arm’s trademarks.
 
 ## Copyright
 
-* Copyright 2014-2024 Arm Limited and/or its affiliates <open-source-office@arm.com>
+* Copyright 2014-2025 Arm Limited and/or its affiliates <open-source-office@arm.com>
 * Copyright 2021 Matt P. Dziubinski <matdzb@gmail.com>
 
 ## Document history
@@ -162,6 +162,13 @@ for more information about Arm’s trademarks.
 
 * Added `fp8` version of the `vget_lane` intrinsic.
 
+### Changes between 2025Q2 and 2025Q3
+
+* Added support for FEAT_FPRCVT intrinsics.
+* Fixed typos in the "AArch64 Instruction" and "Result" fields of
+  floating point conversion intrinsics from "Half Precision to 32-bit"
+  and "Half Precision to 64-bit".
+
 <!---
 **** Do not remove! ****
 The line following this comment is necessary to generate custom geometry settings
diff --git a/tools/intrinsic_db/advsimd.csv b/tools/intrinsic_db/advsimd.csv
index 7b51c965..bec94b7e 100644
--- a/tools/intrinsic_db/advsimd.csv
+++ b/tools/intrinsic_db/advsimd.csv
@@ -1,4 +1,4 @@
-<COMMENT>	SPDX-FileCopyrightText: Copyright 2014-2024 Arm Limited <open-source-office@arm.com>
+<COMMENT>	SPDX-FileCopyrightText: Copyright 2014-2025 Arm Limited <open-source-office@arm.com>
 <COMMENT>	SPDX-FileCopyrightText: Copyright 2021 Matt P. Dziubinski <matdzb@gmail.com>
 <COMMENT>	SPDX-License-Identifier: Apache-2.0
 <COMMENT>	
@@ -1168,15 +1168,25 @@ int32x4_t vcvtaq_s32_f32(float32x4_t a)	a -> Vn.4S	FCVTAS Vd.4S,Vn.4S	Vd.4S -> r
 uint32x2_t vcvta_u32_f32(float32x2_t a)	a -> Vn.2S	FCVTAU Vd.2S,Vn.2S	Vd.2S -> result	A32/A64
 uint32x4_t vcvtaq_u32_f32(float32x4_t a)	a -> Vn.4S	FCVTAU Vd.4S,Vn.4S	Vd.4S -> result	A32/A64
 int32_t vcvts_s32_f32(float32_t a)	a -> Sn	FCVTZS Sd,Sn	Sd -> result	A64
+int64_t vcvts_s64_f32(float32_t a)	a -> Sn	FCVTZS Dd,Sn	Dd -> result	A64
 uint32_t vcvts_u32_f32(float32_t a)	a -> Sn	FCVTZU Sd,Sn	Sd -> result	A64
+uint64_t vcvts_u64_f32(float32_t a)	a -> Sn	FCVTZU Dd,Sn	Dd -> result	A64
 int32_t vcvtns_s32_f32(float32_t a)	a -> Sn	FCVTNS Sd,Sn	Sd -> result	A64
+int64_t vcvtns_s64_f32(float32_t a)	a -> Sn	FCVTNS Dd,Sn	Dd -> result	A64
 uint32_t vcvtns_u32_f32(float32_t a)	a -> Sn	FCVTNU Sd,Sn	Sd -> result	A64
+uint64_t vcvtns_u64_f32(float32_t a)	a -> Sn	FCVTNU Dd,Sn	Dd -> result	A64
 int32_t vcvtms_s32_f32(float32_t a)	a -> Sn	FCVTMS Sd,Sn	Sd -> result	A64
+int64_t vcvtms_s64_f32(float32_t a)	a -> Sn	FCVTMS Dd,Sn	Dd -> result	A64
 uint32_t vcvtms_u32_f32(float32_t a)	a -> Sn	FCVTMU Sd,Sn	Sd -> result	A64
+uint64_t vcvtms_u64_f32(float32_t a)	a -> Sn	FCVTMU Dd,Sn	Dd -> result	A64
 int32_t vcvtps_s32_f32(float32_t a)	a -> Sn	FCVTPS Sd,Sn	Sd -> result	A64
+int64_t vcvtps_s64_f32(float32_t a)	a -> Sn	FCVTPS Dd,Sn	Dd -> result	A64
 uint32_t vcvtps_u32_f32(float32_t a)	a -> Sn	FCVTPU Sd,Sn	Sd -> result	A64
+uint64_t vcvtps_u64_f32(float32_t a)	a -> Sn	FCVTPU Dd,Sn	Dd -> result	A64
 int32_t vcvtas_s32_f32(float32_t a)	a -> Sn	FCVTAS Sd,Sn	Sd -> result	A64
+int64_t vcvtas_s64_f32(float32_t a)	a -> Sn	FCVTAS Dd,Sn	Dd -> result	A64
 uint32_t vcvtas_u32_f32(float32_t a)	a -> Sn	FCVTAU Sd,Sn	Sd -> result	A64
+uint64_t vcvtas_u64_f32(float32_t a)	a -> Sn	FCVTAU Dd,Sn	Dd -> result	A64
 int64x1_t vcvt_s64_f64(float64x1_t a)	a -> Dn	FCVTZS Dd,Dn	Dd -> result	A64
 int64x2_t vcvtq_s64_f64(float64x2_t a)	a -> Vn.2D	FCVTZS Vd.2D,Vn.2D	Vd.2D -> result	A64
 uint64x1_t vcvt_u64_f64(float64x1_t a)	a -> Dn	FCVTZU Dd,Dn	Dd -> result	A64
@@ -1197,15 +1207,25 @@ int64x1_t vcvta_s64_f64(float64x1_t a)	a -> Dn	FCVTAS Dd,Dn	Dd -> result	A64
 int64x2_t vcvtaq_s64_f64(float64x2_t a)	a -> Vn.2D	FCVTAS Vd.2D,Vn.2D	Vd.2D -> result	A64
 uint64x1_t vcvta_u64_f64(float64x1_t a)	a -> Dn	FCVTAU Dd,Dn	Dd -> result	A64
 uint64x2_t vcvtaq_u64_f64(float64x2_t a)	a -> Vn.2D	FCVTAU Vd.2D,Vn.2D	Vd.2D -> result	A64
+int32_t vcvtd_s32_f64(float64_t a)	a -> Dn	FCVTZS Sd,Dn	Sd -> result	A64
 int64_t vcvtd_s64_f64(float64_t a)	a -> Dn	FCVTZS Dd,Dn	Dd -> result	A64
+uint32_t vcvtd_u32_f64(float64_t a)	a -> Dn	FCVTZU Sd,Dn	Sd -> result	A64
 uint64_t vcvtd_u64_f64(float64_t a)	a -> Dn	FCVTZU Dd,Dn	Dd -> result	A64
+int32_t vcvtnd_s32_f64(float64_t a)	a -> Dn	FCVTNS Sd,Dn	Sd -> result	A64
 int64_t vcvtnd_s64_f64(float64_t a)	a -> Dn	FCVTNS Dd,Dn	Dd -> result	A64
+uint32_t vcvtnd_u32_f64(float64_t a)	a -> Dn	FCVTNU Sd,Dn	Sd -> result	A64
 uint64_t vcvtnd_u64_f64(float64_t a)	a -> Dn	FCVTNU Dd,Dn	Dd -> result	A64
+int32_t vcvtmd_s32_f64(float64_t a)	a -> Dn	FCVTMS Sd,Dn	Sd -> result	A64
 int64_t vcvtmd_s64_f64(float64_t a)	a -> Dn	FCVTMS Dd,Dn	Dd -> result	A64
+uint32_t vcvtmd_u32_f64(float64_t a)	a -> Dn	FCVTMU Sd,Dn	Sd -> result	A64
 uint64_t vcvtmd_u64_f64(float64_t a)	a -> Dn	FCVTMU Dd,Dn	Dd -> result	A64
+int32_t vcvtpd_s32_f64(float64_t a)	a -> Dn	FCVTPS Sd,Dn	Sd -> result	A64
 int64_t vcvtpd_s64_f64(float64_t a)	a -> Dn	FCVTPS Dd,Dn	Dd -> result	A64
+uint32_t vcvtpd_u32_f64(float64_t a)	a -> Dn	FCVTPU Sd,Dn	Sd -> result	A64
 uint64_t vcvtpd_u64_f64(float64_t a)	a -> Dn	FCVTPU Dd,Dn	Dd -> result	A64
+int32_t vcvtad_s32_f64(float64_t a)	a -> Dn	FCVTAS Sd,Dn	Sd -> result	A64
 int64_t vcvtad_s64_f64(float64_t a)	a -> Dn	FCVTAS Dd,Dn	Dd -> result	A64
+uint32_t vcvtad_u32_f64(float64_t a)	a -> Dn	FCVTAU Sd,Dn	Sd -> result	A64
 uint64_t vcvtad_u64_f64(float64_t a)	a -> Dn	FCVTAU Dd,Dn	Dd -> result	A64
 int32x2_t vcvt_n_s32_f32(float32x2_t a, __builtin_constant_p(n))	a -> Vn.2S;1 <= n <= 32	FCVTZS Vd.2S,Vn.2S,#n	Vd.2S -> result	v7/A32/A64
 int32x4_t vcvtq_n_s32_f32(float32x4_t a, __builtin_constant_p(n))	a -> Vn.4S;1 <= n <= 32	FCVTZS Vd.4S,Vn.4S,#n	Vd.4S -> result	v7/A32/A64
@@ -4083,35 +4103,35 @@ float16_t vcvth_f16_u16(uint16_t a)	a -> Hn	UCVTF Hd,Hn	Hd -> result	A64
 float16_t vcvth_f16_u32(uint32_t a)	a -> Hn	UCVTF Hd,Hn	Hd -> result	A32/A64
 float16_t vcvth_f16_u64(uint64_t a)	a -> Hn	UCVTF Hd,Hn	Hd -> result	A64
 int16_t vcvth_s16_f16(float16_t a)	a -> Hn	FCVTZS Hd,Hn	Hd -> result	A64
-int32_t vcvth_s32_f16(float16_t a)	a -> Hn	FCVTZS Hd,Hn	Hd -> result	A32/A64
-int64_t vcvth_s64_f16(float16_t a)	a -> Hn	FCVTZS Hd,Hn	Hd -> result	A64
+int32_t vcvth_s32_f16(float16_t a)	a -> Hn	FCVTZS Sd,Hn	Sd -> result	A64
+int64_t vcvth_s64_f16(float16_t a)	a -> Hn	FCVTZS Dd,Hn	Dd -> result	A64
 uint16_t vcvth_u16_f16(float16_t a)	a -> Hn	FCVTZU Hd,Hn	Hd -> result	A64
-uint32_t vcvth_u32_f16(float16_t a)	a -> Hn	FCVTZU Hd,Hn	Hd -> result	A32/A64
-uint64_t vcvth_u64_f16(float16_t a)	a -> Hn	FCVTZU Hd,Hn	Hd -> result	A64
+uint32_t vcvth_u32_f16(float16_t a)	a -> Hn	FCVTZU Sd,Hn	Sd -> result	A64
+uint64_t vcvth_u64_f16(float16_t a)	a -> Hn	FCVTZU Dd,Hn	Dd -> result	A64
 int16_t vcvtah_s16_f16(float16_t a)	a -> Hn	FCVTAS Hd,Hn	Hd -> result	A64
-int32_t vcvtah_s32_f16(float16_t a)	a -> Hn	FCVTAS Hd,Hn	Hd -> result	A32/A64
-int64_t vcvtah_s64_f16(float16_t a)	a -> Hn	FCVTAS Hd,Hn	Hd -> result	A64
+int32_t vcvtah_s32_f16(float16_t a)	a -> Hn	FCVTAS Sd,Hn	Sd -> result	A64
+int64_t vcvtah_s64_f16(float16_t a)	a -> Hn	FCVTAS Dd,Hn	Dd -> result	A64
 uint16_t vcvtah_u16_f16(float16_t a)	a -> Hn	FCVTAU Hd,Hn	Hd -> result	A64
-uint32_t vcvtah_u32_f16(float16_t a)	a -> Hn	FCVTAU Hd,Hn	Hd -> result	A32/A64
-uint64_t vcvtah_u64_f16(float16_t a)	a -> Hn	FCVTAU Hd,Hn	Hd -> result	A64
+uint32_t vcvtah_u32_f16(float16_t a)	a -> Hn	FCVTAU Sd,Hn	Sd -> result	A64
+uint64_t vcvtah_u64_f16(float16_t a)	a -> Hn	FCVTAU Dd,Hn	Dd -> result	A64
 int16_t vcvtmh_s16_f16(float16_t a)	a -> Hn	FCVTMS Hd,Hn	Hd -> result	A64
-int32_t vcvtmh_s32_f16(float16_t a)	a -> Hn	FCVTMS Hd,Hn	Hd -> result	A32/A64
-int64_t vcvtmh_s64_f16(float16_t a)	a -> Hn	FCVTMS Hd,Hn	Hd -> result	A64
+int32_t vcvtmh_s32_f16(float16_t a)	a -> Hn	FCVTMS Sd,Hn	Sd -> result	A64
+int64_t vcvtmh_s64_f16(float16_t a)	a -> Hn	FCVTMS Dd,Hn	Dd -> result	A64
 uint16_t vcvtmh_u16_f16(float16_t a)	a -> Hn	FCVTMU Hd,Hn	Hd -> result	A64
-uint32_t vcvtmh_u32_f16(float16_t a)	a -> Hn	FCVTMU Hd,Hn	Hd -> result	A32/A64
-uint64_t vcvtmh_u64_f16(float16_t a)	a -> Hn	FCVTMU Hd,Hn	Hd -> result	A64
+uint32_t vcvtmh_u32_f16(float16_t a)	a -> Hn	FCVTMU Sd,Hn	Sd -> result	A64
+uint64_t vcvtmh_u64_f16(float16_t a)	a -> Hn	FCVTMU Dd,Hn	Dd -> result	A64
 int16_t vcvtnh_s16_f16(float16_t a)	a -> Hn	FCVTNS Hd,Hn	Hd -> result	A64
-int32_t vcvtnh_s32_f16(float16_t a)	a -> Hn	FCVTNS Hd,Hn	Hd -> result	A32/A64
-int64_t vcvtnh_s64_f16(float16_t a)	a -> Hn	FCVTNS Hd,Hn	Hd -> result	A64
+int32_t vcvtnh_s32_f16(float16_t a)	a -> Hn	FCVTNS Sd,Hn	Sd -> result	A64
+int64_t vcvtnh_s64_f16(float16_t a)	a -> Hn	FCVTNS Dd,Hn	Dd -> result	A64
 uint16_t vcvtnh_u16_f16(float16_t a)	a -> Hn	FCVTNU Hd,Hn	Hd -> result	A64
-uint32_t vcvtnh_u32_f16(float16_t a)	a -> Hn	FCVTNU Hd,Hn	Hd -> result	A32/A64
-uint64_t vcvtnh_u64_f16(float16_t a)	a -> Hn	FCVTNU Hd,Hn	Hd -> result	A64
+uint32_t vcvtnh_u32_f16(float16_t a)	a -> Hn	FCVTNU Sd,Hn	Sd -> result	A64
+uint64_t vcvtnh_u64_f16(float16_t a)	a -> Hn	FCVTNU Dd,Hn	Dd -> result	A64
 int16_t vcvtph_s16_f16(float16_t a)	a -> Hn	FCVTPS Hd,Hn	Hd -> result	A64
-int32_t vcvtph_s32_f16(float16_t a)	a -> Hn	FCVTPS Hd,Hn	Hd -> result	A32/A64
-int64_t vcvtph_s64_f16(float16_t a)	a -> Hn	FCVTPS Hd,Hn	Hd -> result	A64
+int32_t vcvtph_s32_f16(float16_t a)	a -> Hn	FCVTPS Sd,Hn	Sd -> result	A64
+int64_t vcvtph_s64_f16(float16_t a)	a -> Hn	FCVTPS Dd,Hn	Dd -> result	A64
 uint16_t vcvtph_u16_f16(float16_t a)	a -> Hn	FCVTPU Hd,Hn	Hd -> result	A64
-uint32_t vcvtph_u32_f16(float16_t a)	a -> Hn	FCVTPU Hd,Hn	Hd -> result	A32/A64
-uint64_t vcvtph_u64_f16(float16_t a)	a -> Hn	FCVTPU Hd,Hn	Hd -> result	A64
+uint32_t vcvtph_u32_f16(float16_t a)	a -> Hn	FCVTPU Sd,Hn	Sd -> result	A64
+uint64_t vcvtph_u64_f16(float16_t a)	a -> Hn	FCVTPU Dd,Hn	Dd -> result	A64
 float16_t vnegh_f16(float16_t a)	a -> Hn	FNEG Hd,Hn	Hd -> result	A32/A64
 float16_t vrecpeh_f16(float16_t a)	a -> Hn	FRECPE Hd,Hn	Hd -> result	A64
 float16_t vrecpxh_f16(float16_t a)	a -> Hn	FRECPX Hd,Hn	Hd -> result	A64
@@ -4810,3 +4830,7 @@ float32x4_t vmlalltbq_lane_f32_mf8_fpm(float32x4_t vd, mfloat8x16_t vn, mfloat8x
 float32x4_t vmlalltbq_laneq_f32_mf8_fpm(float32x4_t vd, mfloat8x16_t vn, mfloat8x16_t vm, __builtin_constant_p(lane), fpm_t fpm)	vd -> Vd.4S;vm -> Vn.16B; vm -> Vm.B; 0 <= lane <= 15	FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]	Vd.4S -> result	A64
 float32x4_t vmlallttq_lane_f32_mf8_fpm(float32x4_t vd, mfloat8x16_t vn, mfloat8x8_t vm, __builtin_constant_p(lane), fpm_t fpm)	vd -> Vd.4S;vm -> Vn.16B; vm -> Vm.B; 0 <= lane <= 7	FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]	Vd.4S -> result	A64
 float32x4_t vmlallttq_laneq_f32_mf8_fpm(float32x4_t vd, mfloat8x16_t vn, mfloat8x16_t vm, __builtin_constant_p(lane), fpm_t fpm)	vd -> Vd.4S;vm -> Vn.16B; vm -> Vm.B; 0 <= lane <= 15	FMLALLBB Vd.4S, Vn.16B, Vm.B[lane]	Vd.4S -> result	A64
+
+<SECTION>	Matrix multiplication intrinsics from Armv9.6-A
+float16x4_t vmmlaq_f16_mf8(float16x4_t r, mfloat8x16_t a, mfloat8x16_t b)	r -> Vd.4H;a -> Vn.16B;b -> Vm.16B	FMMLA Vd.4H, Vn.16B, Vm.16B	Vd.4H -> result	A64
+float32x4_t vmmlaq_f32_mf8(float32x4_t r, mfloat8x16_t a, mfloat8x16_t b)	r -> Vd.4S;a -> Vn.16B;b -> Vm.16B	FMMLA Vd.4S, Vn.16B, Vm.16B	Vd.4S -> result	A64
diff --git a/tools/intrinsic_db/advsimd_classification.csv b/tools/intrinsic_db/advsimd_classification.csv
index a5e75510..2e686e7c 100644
--- a/tools/intrinsic_db/advsimd_classification.csv
+++ b/tools/intrinsic_db/advsimd_classification.csv
@@ -1167,15 +1167,25 @@ vcvtaq_s32_f32	Data type conversion|Conversions
 vcvta_u32_f32	Data type conversion|Conversions
 vcvtaq_u32_f32	Data type conversion|Conversions
 vcvts_s32_f32	Data type conversion|Conversions
+vcvts_s64_f32	Data type conversion|Conversions
 vcvts_u32_f32	Data type conversion|Conversions
+vcvts_u64_f32	Data type conversion|Conversions
 vcvtns_s32_f32	Data type conversion|Conversions
+vcvtns_s64_f32	Data type conversion|Conversions
 vcvtns_u32_f32	Data type conversion|Conversions
+vcvtns_u64_f32	Data type conversion|Conversions
 vcvtms_s32_f32	Data type conversion|Conversions
+vcvtms_s64_f32	Data type conversion|Conversions
 vcvtms_u32_f32	Data type conversion|Conversions
+vcvtms_u64_f32	Data type conversion|Conversions
 vcvtps_s32_f32	Data type conversion|Conversions
+vcvtps_s64_f32	Data type conversion|Conversions
 vcvtps_u32_f32	Data type conversion|Conversions
+vcvtps_u64_f32	Data type conversion|Conversions
 vcvtas_s32_f32	Data type conversion|Conversions
+vcvtas_s64_f32	Data type conversion|Conversions
 vcvtas_u32_f32	Data type conversion|Conversions
+vcvtas_u64_f32	Data type conversion|Conversions
 vcvt_s64_f64	Data type conversion|Conversions
 vcvtq_s64_f64	Data type conversion|Conversions
 vcvt_u64_f64	Data type conversion|Conversions
@@ -1196,15 +1206,25 @@ vcvta_s64_f64	Data type conversion|Conversions
 vcvtaq_s64_f64	Data type conversion|Conversions
 vcvta_u64_f64	Data type conversion|Conversions
 vcvtaq_u64_f64	Data type conversion|Conversions
+vcvtd_s32_f64	Data type conversion|Conversions
 vcvtd_s64_f64	Data type conversion|Conversions
+vcvtd_u32_f64	Data type conversion|Conversions
 vcvtd_u64_f64	Data type conversion|Conversions
+vcvtnd_s32_f64	Data type conversion|Conversions
 vcvtnd_s64_f64	Data type conversion|Conversions
+vcvtnd_u32_f64	Data type conversion|Conversions
 vcvtnd_u64_f64	Data type conversion|Conversions
+vcvtmd_s32_f64	Data type conversion|Conversions
 vcvtmd_s64_f64	Data type conversion|Conversions
+vcvtmd_u32_f64	Data type conversion|Conversions
 vcvtmd_u64_f64	Data type conversion|Conversions
+vcvtpd_s32_f64	Data type conversion|Conversions
 vcvtpd_s64_f64	Data type conversion|Conversions
+vcvtpd_u32_f64	Data type conversion|Conversions
 vcvtpd_u64_f64	Data type conversion|Conversions
+vcvtad_s32_f64	Data type conversion|Conversions
 vcvtad_s64_f64	Data type conversion|Conversions
+vcvtad_u32_f64	Data type conversion|Conversions
 vcvtad_u64_f64	Data type conversion|Conversions
 vcvt_n_s32_f32	Data type conversion|Conversions
 vcvtq_n_s32_f32	Data type conversion|Conversions
@@ -4697,3 +4717,5 @@ vmlalltbq_lane_f32_mf8_fpm	Vector arithmetic|Multiply|Multiply-accumulate and wi
 vmlalltbq_laneq_f32_mf8_fpm	Vector arithmetic|Multiply|Multiply-accumulate and widen
 vmlallttq_lane_f32_mf8_fpm	Vector arithmetic|Multiply|Multiply-accumulate and widen
 vmlallttq_laneq_f32_mf8_fpm	Vector arithmetic|Multiply|Multiply-accumulate and widen
+vmmlaq_f16_mf8	Vector arithmetic|Matrix multiply
+vmmlaq_f32_mf8	Vector arithmetic|Matrix multiply