llama.cpp/examples/retrieval/retrieval.cpp at 409dc4f8bb5185786087f52259ee4626be93f54d

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-02 09:12:03 +00:00

Files

gtygo 4b9afbbe90 retrieval : fix memory leak in retrieval query handling (#8955 )

* retrieval

* Reuse querybatch to reduce frequent memory allocation

* delete unused white space

2024-08-15 10:40:12 +03:00

View Raw