cmake : Resolve quantized model issue when CUBLAS enabled #1667

bobqianic · 2023-12-20T23:28:13Z

Thanks for the help provided by @slaren, the problem is finally solved!
See #1661 for details

Sing303 · 2023-12-21T07:49:03Z

Something similar has been done here #1499

* ggerganov/master: whisper : Replace WHISPER_PRINT_DEBUG with WHISPER_LOG_DEBUG (ggerganov#1681) sync : ggml (ggml_scale, ggml_row_size, etc.) (ggerganov#1677) docker : Dockerize whisper.cpp (ggerganov#1674) CI : Add coverage for talk-llama when WHISPER_CUBLAS=1 (ggerganov#1672) examples : Revert CMakeLists.txt for talk-llama (ggerganov#1669) cmake : set default CUDA architectures (ggerganov#1667)

Update CMakeLists.txt

c116542

bobqianic linked an issue Dec 20, 2023 that may be closed by this pull request

Quantized model is not working properly when CUBLAS is ON #1661

Closed

bobqianic requested a review from ggerganov December 20, 2023 23:29

ggerganov approved these changes Dec 21, 2023

View reviewed changes

ggerganov merged commit 8986690 into ggerganov:master Dec 21, 2023
37 checks passed

bobqianic deleted the fix-quantized branch December 21, 2023 14:16

viktor-silakov pushed a commit to viktor-silakov/whisper_node_mic.cpp that referenced this pull request May 11, 2024

cmake : set default CUDA architectures (ggerganov#1667)

25b0868

iThalay pushed a commit to iThalay/whisper.cpp that referenced this pull request Sep 23, 2024

cmake : set default CUDA architectures (ggerganov#1667)

82a90d5

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

cmake : Resolve quantized model issue when CUBLAS enabled #1667

cmake : Resolve quantized model issue when CUBLAS enabled #1667

bobqianic commented Dec 20, 2023

Sing303 commented Dec 21, 2023

cmake : Resolve quantized model issue when CUBLAS enabled #1667

cmake : Resolve quantized model issue when CUBLAS enabled #1667

Conversation

bobqianic commented Dec 20, 2023

Sing303 commented Dec 21, 2023