llama.cpp/examples/server/server.cpp at 4b1c3c98b442a4c84a788fff6323f6fa7e678a5b

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-01 09:01:57 +00:00

Files

Pierrick Hymbert 7f5ff558ee server: stop generation at n_ctx_train if n_predict is not set (#6638 )

* server: cap n_predict if not set to n_ctx_train

* server: fix infinite loop

* server: infinite loop, move in process_token
server: infinite loop: set stop limit to true

* minor: spaces

* minor: spaces

* server: include prompt tokens in the EOS limit

2024-04-26 12:15:30 +02:00

154 KiB

Raw Blame History

View Raw

154 KiB Raw Blame History

154 KiB

Raw Blame History