gguf : start implementing quantization (WIP)

2025-11-01 09:01:57 +00:00 · 2023-08-12 12:01:17 +03:00
parent 0e1a3c7e7d
commit c4f02b4f74
2 changed files with 5 additions and 2 deletions
--- a/gguf-llama.cpp
+++ b/gguf-llama.cpp
@@ -778,8 +778,7 @@ struct gguf_file_saver {
        }
        
        write_tensor_info(tensor);
-        // file.write_raw(new_data);
-        GGML_UNUSED(new_data);
+        file.write_raw(new_data, new_size);
        size_t padded_size = GGML_PAD(new_size, GGUF_DEFAULT_ALIGNMENT); // TODO: handle custom alignment
        size_t pad = padded_size - new_size;
        file.write_zeros(pad);