llama.cpp/examples/retrieval/retrieval.cpp at 6494509801647e270aad076a9b50f17e863e0a60

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-06 09:46:50 +00:00

Files

gtygo 4b9afbbe90 retrieval : fix memory leak in retrieval query handling (#8955 )

* retrieval

* Reuse querybatch to reduce frequent memory allocation

* delete unused white space

2024-08-15 10:40:12 +03:00

View Raw