quic · mohiso22 · Apr 11, 2025 · Jul 3, 2025
@@ -58,6 +58,10 @@
     MistralModel,
     MistralRMSNorm,
 )
+from transformers.models.mistral3.modeling_mistral3 import (
+    Mistral3ForConditionalGeneration,
+    Mistral3RMSNorm,
+)
 from transformers.models.mixtral.modeling_mixtral import (
     MixtralAttention,
     MixtralDecoderLayer,
@@ -70,6 +74,7 @@
 from transformers.models.mpt.modeling_mpt import MptAttention, MptBlock, MptForCausalLM, MptModel
 from transformers.models.phi.modeling_phi import PhiAttention, PhiForCausalLM, PhiModel
 from transformers.models.phi3.modeling_phi3 import Phi3Attention, Phi3ForCausalLM, Phi3Model, Phi3RMSNorm
+from transformers.models.pixtral.modeling_pixtral import PixtralRMSNorm
 from transformers.models.qwen2.modeling_qwen2 import Qwen2Attention, Qwen2ForCausalLM, Qwen2Model, Qwen2RMSNorm
 from transformers.models.starcoder2.modeling_starcoder2 import (
     Starcoder2Attention,
@@ -88,6 +93,7 @@
 )
 
 from QEfficient.customop import CustomRMSNormAIC
+from QEfficient.transformers.models.mistral3.modeling_mistral3 import QEffMistral3ForConditionalGeneration
 
 # Placeholder for all non-transformer models
 from .models.codegen.modeling_codegen import (
@@ -179,6 +185,7 @@
         GPTBigCodeForCausalLM.__name__,
         MllamaForCausalLM.__name__,
         WhisperForConditionalGeneration.__name__,
+        Mistral3ForConditionalGeneration.__name__,
     ]
 )
 
@@ -230,6 +237,9 @@
     MistralModel: QEffMistralModel,
     MistralForCausalLM: QEffMistralForCausalLM,
     MistralRMSNorm: CustomRMSNormAIC,
+    # Mistral3 model layers
+    Mistral3ForConditionalGeneration: QEffMistral3ForConditionalGeneration,
+    Mistral3RMSNorm: CustomRMSNormAIC,
     # Mixtral model layers
     MixtralAttention: QEffMixtralAttention,
     MixtralDecoderLayer: QeffMixtralDecoderLayer,
@@ -246,6 +256,8 @@
     PhiAttention: QEffPhiAttention,
     PhiModel: QEffPhiModel,
     PhiForCausalLM: QEffPhiForCausalLM,
+    # Pixtral model layers
+    PixtralRMSNorm: CustomRMSNormAIC,
     # Falcon model layers
     FalconAttention: QEffFalconAttention,
     FalconForCausalLM: QEffFalconForCausalLM,

@@ -0,0 +1,6 @@
+# -----------------------------------------------------------------------------
+#
+# Copyright (c) 2025 Qualcomm Innovation Center, Inc. All rights reserved.
+# SPDX-License-Identifier: BSD-3-Clause
+#
+# -----------------------------------------------------------------------------