llama.cpp/examples/server/server.cpp at 5fd89a70ead34d1a17015ddecad05aaa2490ca46

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-30 08:42:00 +00:00

Files

compilade 98a532d474 server : fix segfault on long system prompt (#8987 )

* server : fix segfault on long system prompt

* server : fix parallel generation with very small batch sizes

* server : fix typo in comment

2024-08-14 09:51:02 +03:00

View Raw