ENH: Remove quantization limits for Apple METAL device when running model via `llama-cpp-python`#1134

Merged

aresnow1 merged 1 commit intoxorbitsai:mainfrom ChengjieLi28:enh/support_more_gguf_quan_on_metal

Mar 13, 2024

+1-5

Commits on Mar 12, 2024

dev
ChengjieLi28
committed