Update mixtral.py

wenxcs · web-flow · commit 4e6c35a4c6e1 · 2024-05-14T23:25:37.000+08:00
diff --git a/vllm/model_executor/models/mixtral.py b/vllm/model_executor/models/mixtral.py
@@ -54,16 +54,6 @@
 from vllm.utils import print_warning_once
 
 
-def is_sm80(device_id=0):
-    if not torch.cuda.is_available():
-        return False
-    device_properties = torch.cuda.get_device_properties(device_id)
-    return (device_properties.major == 8 and device_properties.minor == 0)
-
-if is_sm80():
-    from vllm.model_executor.layers.fused_moe import ampere_fp8_fused_moe
-    fused_moe = ampere_fp8_fused_moe
-
 logger = logging.get_logger(__name__)