Merge branch 'add-fh1-rebased' of https://github.com/tiiuae/llama.cpp-public into add-fh1-rebased

2025-11-04 09:32:00 +00:00 · 2025-07-04 16:25:54 +04:00
parent 3ee7983961 250b4f1074
commit 2aa48dd853
1 changed files with 7 additions and 0 deletions
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -607,7 +607,14 @@ class TextModel(ModelBase):

        from transformers import AutoTokenizer
        tokenizer = AutoTokenizer.from_pretrained(self.dir_model)
+<<<<<<< HEAD
        vocab_size = self.hparams.get("vocab_size", len(tokenizer.vocab))
+=======
+        vocab_size = min(
+            self.hparams.get("vocab_size", len(tokenizer.vocab)),
+            len(tokenizer.vocab)
+        )
+>>>>>>> 250b4f1074da288399e71577a925aa83acf316d5
        assert max(tokenizer.vocab.values()) < vocab_size

        tokpre = self.get_vocab_base_pre(tokenizer)