llama.cpp/examples/server/oai.hpp at a1d6df129bcd3d42cda38c09217d8d4ec4ea3bdd

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-31 08:51:55 +00:00

Files

Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065 )

* server: add llama_server_queue struct

* server: add llama_server_response_event

* server: add comments

* server: move all mutexes away from server.cpp

* server: correct multitask response

* server: only add back deferred tasks when one slot is available

* server: fix a race condition cause by "request_completion"

2024-01-26 14:42:20 +02:00

8.7 KiB

Raw Blame History

View Raw

8.7 KiB Raw Blame History

8.7 KiB

Raw Blame History