llama.cpp/examples/batched-bench/batched-bench.cpp at 5fe268a4d9ce09f3a6c77239af583d3a8e49d54c

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-01 09:01:57 +00:00

Files

Georgi Gerganov 8c70a5ff25 batched : add bench tool (#3545 )

* batched : add bench tool

* batched : minor fix table

* batched-bench : add readme + n_kv_max is now configurable

* batched-bench : init warm-up batch

* batched-bench : pass custom set of PP, TG and PL

* batched-bench : add mmq CLI arg

2023-10-11 21:25:33 +03:00

7.2 KiB

Raw Blame History

View Raw

7.2 KiB Raw Blame History

7.2 KiB

Raw Blame History