llama.cpp/convert_hf_to_gguf.py at f09aefaa84d7f4d5df3f400f67944b94fef5b795

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-08 10:07:01 +00:00

Files

Shunta Saito ded67b9444 llama : parameter conversion and loading fixes for PLaMo2 variants (#16075 )

* Fix to use hidden_size_per_head

* Fix num heads

* Fix array

* Fix loading weights

* Support old GGUF converted by the previous version of llama.cpp

* Update src/llama-model.cpp

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

* Move shared parameter definitions to the outside of loop

* Not calculating n_embd_head_k,v by n_embd / n_head

---------

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

2025-10-01 23:08:15 +02:00

428 KiB

Executable File

Raw Blame History

View Raw

428 KiB Executable File Raw Blame History

428 KiB

Executable File

Raw Blame History