llama.cpp/examples/retrieval/retrieval.cpp at 581c305186a0ff93f360346c57e21fe16e967bb7

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-31 08:51:55 +00:00

Files

gtygo 4b9afbbe90 retrieval : fix memory leak in retrieval query handling (#8955 )

* retrieval

* Reuse querybatch to reduce frequent memory allocation

* delete unused white space

2024-08-15 10:40:12 +03:00

View Raw