llama.cpp/ggml/src/ggml-cuda/cp-async.cuh at 03d46982180c2fb624bd2a233e46426ab22be5d1

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-16 11:27:03 +00:00

Files

Johannes Gäßler 0cf6725e9f CUDA: FA support for Deepseek (Ampere or newer) (#13306 )

* CUDA: FA support for Deepseek (Ampere or newer)

* do loop unrolling via C++ template

2025-05-09 13:34:58 +02:00

View Raw