add more version checking

liangel-02 · liangel-02 · commit 7f82f6908d42 · 2025-09-22T14:18:07.000-07:00
diff --git a/src/transformers/quantizers/quantizer_torchao.py b/src/transformers/quantizers/quantizer_torchao.py
@@ -98,6 +98,8 @@ def _linear_extra_repr(self):
         torchao.quantization.Float8DynamicActivationFloat8WeightConfig,
     ]
 
+    TORCHAO_VERSION = version.parse(importlib.metadata.version("torchao"))
+
 
 class TorchAoHfQuantizer(HfQuantizer):
     """
@@ -160,12 +162,13 @@ def get_state_dict_and_metadata(self, model, safe_serialization: Optional[bool]
         If the model is safe serializable, we flatten the state dict of tensor subclasses so that it is compatible with
         the safetensors format.
         """
-        if (
-            type(self.quantization_config.quant_type) in SUPPORTED_SAFE_SERIALIZATION_CONFIGS
-            and safe_serialization
-            and version.parse(importlib.metadata.version("torchao")) >= version.parse("0.14.0")
-        ):
-            return flatten_tensor_state_dict(model.state_dict())
+        if type(self.quantization_config.quant_type) in SUPPORTED_SAFE_SERIALIZATION_CONFIGS and safe_serialization:
+            if TORCHAO_VERSION >= version.parse("0.14.0"):
+                return flatten_tensor_state_dict(model.state_dict())
+            else:
+                raise RuntimeError(
+                    f"In order to use safetensors with torchao, please use torchao version >= 0.14.0. Current version: {TORCHAO_VERSION}"
+                )
         else:
             return super().get_state_dict_and_metadata(model)
 
@@ -316,9 +319,7 @@ def update_state_dict_with_metadata(self, state_dict, metadata):
         If the metadata contains torchao tensor subclass information, we reconstruct the tensor subclass state dict
         from the provided state_dict and metadata.
         """
-        if version.parse(importlib.metadata.version("torchao")) >= version.parse("0.14.0") and is_metadata_torchao(
-            metadata
-        ):
+        if TORCHAO_VERSION >= version.parse("0.14.0") and is_metadata_torchao(metadata):
             return unflatten_tensor_state_dict(state_dict, metadata)
         else:
             return super().update_state_dict_with_metadata(state_dict, metadata)
@@ -341,9 +342,9 @@ def _process_model_after_weight_loading(self, model, **kwargs):
 
     def is_serializable(self, safe_serialization=None) -> bool:
         if safe_serialization:
-            _is_torchao_serializable = (
-                type(self.quantization_config.quant_type) in SUPPORTED_SAFE_SERIALIZATION_CONFIGS
-            )
+            _is_torchao_serializable = type(
+                self.quantization_config.quant_type
+            ) in SUPPORTED_SAFE_SERIALIZATION_CONFIGS and TORCHAO_VERSION >= version.parse("0.14.0")
             if not _is_torchao_serializable:
                 logger.warning(
                     f"torchao quantized model only supports safe serialization for {SUPPORTED_SAFE_SERIALIZATION_CONFIGS}, \