llama.cpp/tools/llama-bench/llama-bench.cpp at 7474e00b34629e9cd8b06bc87ad935584ea30f8e - llama.cpp - Gitea - Peisong Xiao

CS348Project/llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-14 11:07:10 +00:00

Files

David Huang 7f323a589f Add --no-op-offload to improve -ot pp perf in MoE models like llama4 400B (#13386 )

2025-05-11 14:18:39 +02:00

72 KiB

Raw Blame History

View Raw