CUDA: mul_mat_q=true llama_context_params default (#2912)

2025-10-30 08:42:00 +00:00 · 2023-08-30 21:46:19 +02:00
parent 71d6975559
commit 8afe228000
1 changed files with 1 additions and 1 deletions
--- a/llama.cpp
+++ b/llama.cpp
@@ -5287,7 +5287,7 @@ struct llama_context_params llama_context_default_params() {
        /*.progress_callback           =*/ nullptr,
        /*.progress_callback_user_data =*/ nullptr,
        /*.low_vram                    =*/ false,
-        /*.mul_mat_q                   =*/ false,
+        /*.mul_mat_q                   =*/ true,
        /*.f16_kv                      =*/ true,
        /*.logits_all                  =*/ false,
        /*.vocab_only                  =*/ false,