llama.cpp/examples/server/server.cpp at b264eddbb26c695d50d04c37a5b9bb91181bc551

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-09 10:17:06 +00:00

Files

compilade 98a532d474 server : fix segfault on long system prompt (#8987 )

* server : fix segfault on long system prompt

* server : fix parallel generation with very small batch sizes

* server : fix typo in comment

2024-08-14 09:51:02 +03:00

View Raw