llama.cpp/tools/server/server.cpp at 1ee9d0b415cdf5240418c110a18b419f4002b154

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-05 09:36:52 +00:00

Files

Georgi Gerganov bc07349a7f server : dynamic token limit for prompt cache (#16560 )

* server : dynamic token limit for prompt cache

* cont : print estimated token limit

2025-10-14 08:48:50 +03:00

View Raw