llama.cpp/src/llama-hparams.h at e95fec640f43623911a2cd5bda8b19b1898c530c

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-02 09:12:03 +00:00

Files

Shunta Saito ded67b9444 llama : parameter conversion and loading fixes for PLaMo2 variants (#16075 )

* Fix to use hidden_size_per_head

* Fix num heads

* Fix array

* Fix loading weights

* Support old GGUF converted by the previous version of llama.cpp

* Update src/llama-model.cpp

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

* Move shared parameter definitions to the outside of loop

* Not calculating n_embd_head_k,v by n_embd / n_head

---------

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

2025-10-01 23:08:15 +02:00

8.0 KiB

Raw Blame History

View Raw

8.0 KiB Raw Blame History

8.0 KiB

Raw Blame History