automatically calculate compute buffer sizes (without graph allocator)

2025-11-15 11:17:31 +00:00 · 2023-07-20 02:22:54 +02:00
parent 77ac8deaf1
commit cb205c0d13
5 changed files with 132 additions and 53 deletions
--- a/ggml-cuda.cu
+++ b/ggml-cuda.cu
@@ -1726,7 +1726,7 @@ static ggml_backend_buffer * ggml_backend_cuda_alloc_buffer(ggml_backend * backe
    void * data;
    CUDA_CHECK(cudaMalloc(&data, size));

-    ggml_backend_buffer * buffer = ggml_allocator_simple_init(data, size, TENSOR_ALIGNMENT);
+    ggml_backend_buffer * buffer = ggml_allocator_default_init(data, size, TENSOR_ALIGNMENT);
    buffer->interface.free_data = ggml_backend_cuda_free_buffer;
    buffer->backend_data = data;