llama.cpp/convert_hf_to_gguf.py at 1f45f2890ef7f365ba0a45e08a8d1f46b8bc6b9e

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-01 09:01:57 +00:00

Files

Shunta Saito 1dc9614e06 llama : fix kq_scale for the attention layers of PLaMo2 (#14892 )

* Fix dimensions for expand

* Change dimensions to copy states to cache

* Fix the default value for plamo2 conversion

* Fix scale given to build_attn

* Update src/llama-model.cpp

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

* Update src/llama-model.cpp

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

* Update src/llama-model.cpp

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

---------

Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

2025-07-27 09:38:44 +02:00

358 KiB

Executable File

Raw Blame History

View Raw

358 KiB Executable File Raw Blame History

358 KiB

Executable File

Raw Blame History