llama.cpp/examples/server/server.cpp at efb6ae963031709fc331e6e48cc4606ac8f9c3a7

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-02 09:12:03 +00:00

Files

Georgi Gerganov 70b98fadbc server : fix default draft model parameters (#10586 )

* server : force F16 KV cache for the draft model

ggml-ci

* server : fix draft params

ggml-ci

* server : various params fixes

ggml-ci

2024-12-03 11:20:00 +02:00

View Raw