llama.cpp/examples/server/server.cpp at 3b4f2e33e2cbfca621e623c4b92b88da57a8c2f4

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-30 08:42:00 +00:00

Files

Georgi Gerganov 70b98fadbc server : fix default draft model parameters (#10586 )

* server : force F16 KV cache for the draft model

ggml-ci

* server : fix draft params

ggml-ci

* server : various params fixes

ggml-ci

2024-12-03 11:20:00 +02:00

View Raw