talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp #2769

kristianmk · 2025-01-29T13:58:00Z

talk-llama: Add a check for deepseek-r1-qwen in llama-vocab.cpp to be able to run models like unsloth/DeepSeek-R1-Distill-Qwen-32B from HuggingFace. A full sync of llama.cpp could be better if that is automated somehow.

Solves the following unknown pre-tokenizer error when running with DeepSeek-R1-Distill-Qwen-32B:
llama_model_load: error loading model: error loading model vocabulary: unknown pre-tokenizer type: 'deepseek-r1-qwen' llama_model_load_from_file: failed to load model No llama.cpp model specified. Please provide using -ml <modelfile>

foldl · 2025-02-05T08:22:03Z

@ggerganov Could talk-llama be moved into llama.cpp? Sync whisper.cpp into llama.cpp looks simpler and less frequent.

ggerganov · 2025-02-05T09:49:09Z

@ggerganov Could talk-llama be moved into llama.cpp? Sync whisper.cpp into llama.cpp looks simpler and less frequent.

It will simplify the sync, yes, but we would need to introduce SDL2 support to llama.cpp examples. And currently it would be used just for this single example. While in whisper.cpp, more examples use SDL2. So I am not very confident that it would be worth it.

talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp

3972a8c

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp #2769

talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp #2769

kristianmk commented Jan 29, 2025

foldl commented Feb 5, 2025

ggerganov commented Feb 5, 2025

talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp #2769

Are you sure you want to change the base?

talk-llama : add check for deepseek-r1-qwen in llama-vocab.cpp #2769

Conversation

kristianmk commented Jan 29, 2025

foldl commented Feb 5, 2025

ggerganov commented Feb 5, 2025