llama.cpp/tools/llama-bench/llama-bench.cpp at c104023994d36a8e791fc6a43789b84fd552cefc - llama.cpp - Gitea - Peisong Xiao

CS348Project/llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-03 09:22:01 +00:00

Files

David Huang 7f323a589f Add --no-op-offload to improve -ot pp perf in MoE models like llama4 400B (#13386 )

2025-05-11 14:18:39 +02:00

72 KiB

Raw Blame History

View Raw