hparams : add n_embd_inp() to support extended embed (#16928)

* add n_embd_full to support extended embed * don't change output * rename to n_embd_inp * restore n_embd where applicable
2025-11-10 10:27:03 +00:00 · 2025-11-07 19:27:58 +01:00
parent 16bcc1259d
commit 9008027aa3
9 changed files with 29 additions and 28 deletions
--- a/src/llama-hparams.cpp
+++ b/src/llama-hparams.cpp
@@ -60,6 +60,16 @@ uint32_t llama_hparams::n_gqa(uint32_t il) const {
    return n_head/n_head_kv;
 }

+uint32_t llama_hparams::n_embd_inp() const {
+    uint32_t n_embd_inp = n_embd;
+
+    if (n_deepstack_layers > 0) {
+        n_embd_inp += n_embd * n_deepstack_layers;
+    }
+
+    return n_embd_inp;
+}
+
 uint32_t llama_hparams::n_embd_k_gqa(uint32_t il) const {
    const uint32_t n_head_kv = this->n_head_kv(il);