Add llamacpp `n_gpu_layers` #4677

garrettsutula · 2023-05-14T18:10:56Z

Add `n-gpu-layers` param to Llama.cpp model & embedding

Adds a parameter n_gpu_layers to Llama.cpp model and embedding implementation to make it possible to load & run w/ GPU. Refer to this Llama.cpp PR for more info: ggerganov/llama.cpp#1412

Who can review?

Community members can review the PR once tests pass. Tag maintainers/contributors who might be interested:

@hwchase17 @agola11

formatamerica added 2 commits May 14, 2023 14:08

Add n_gpu_layers param to llama.cpp model

662aca9

Add n_gpu_layers param to llama.cpp embedding

a0b2627

garrettsutula changed the title ~~Add llamacpp gpu layers~~ Add llamacpp n_gpu_layers May 14, 2023

garrettsutula closed this May 14, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add llamacpp `n_gpu_layers` #4677

Add llamacpp `n_gpu_layers` #4677

garrettsutula commented May 14, 2023

Add llamacpp n_gpu_layers #4677

Add llamacpp n_gpu_layers #4677

Conversation

garrettsutula commented May 14, 2023

Add n-gpu-layers param to Llama.cpp model & embedding

Who can review?

Add llamacpp `n_gpu_layers` #4677

Add llamacpp `n_gpu_layers` #4677

Add `n-gpu-layers` param to Llama.cpp model & embedding