llama.cpp/ggml.c at 24ee66ed0d908d156bd0d1747b63a636a495cd7a

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-01 09:01:57 +00:00

Files

jiez 91c736015b llama : add gguf_remove_key + remove split meta during quantize (#6591 )

* Remove split metadata when quantize model shards

* Find metadata key by enum

* Correct loop range for gguf_remove_key and code format

* Free kv memory

---------

Co-authored-by: z5269887 <z5269887@unsw.edu.au>

2024-04-12 13:45:06 +03:00

695 KiB

Raw Blame History

View Raw

695 KiB Raw Blame History

695 KiB

Raw Blame History