llama.cpp/tools/server/utils.hpp at 6089e08b000a18b35be26cebd405445c059f345d

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-05 09:36:52 +00:00

Files

Georgi Gerganov b52edd2558 server : remove n_past (#16818 )

* server : remove n_past

* server : replace slot.n_prompt_tokens() with slot.task->n_tokens()

* server : fixes + clean-up

* cont : fix context shift

* server : add server_tokens::pos_next()

Co-authored-by: Xuan-Son Nguyen <son@huggingface.co>

* server : fix pos_next() usage

Co-authored-by: Xuan-Son Nguyen <son@huggingface.co>

---------

Co-authored-by: Xuan-Son Nguyen <son@huggingface.co>

2025-10-30 18:42:57 +02:00

57 KiB

Raw Blame History

View Raw

57 KiB Raw Blame History

57 KiB

Raw Blame History