llama : reuse compute graphs

ggml-ci
2025-10-30 08:42:00 +00:00 · 2025-07-01 15:59:43 +03:00
parent bac8bed248
commit 76681e3c73
17 changed files with 458 additions and 187 deletions
--- a/common/common.cpp
+++ b/common/common.cpp
@@ -1157,6 +1157,7 @@ struct llama_context_params common_context_params_to_llama(const common_params &
    cparams.no_perf           = params.no_perf;
    cparams.op_offload        = !params.no_op_offload;
    cparams.swa_full          = params.swa_full;
+    cparams.graph_reuse       = params.graph_reuse;

    cparams.type_k = params.cache_type_k;
    cparams.type_v = params.cache_type_v;