llama.cpp/ggml/src/ggml-cuda/common.cuh at 106220562aca42b6738b8f51acfce0db1b8a2fb6

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-21 12:16:57 +00:00

Files

Johannes Gäßler 0e6ff0046f CUDA: larger SRAM reads for tile FA, AMD FP16 dot (#15927 )

* CUDA: larger SRAM reads for tile FA, AMD FP16 dot

* fix logic for availability of v_dot2_f32_f16

2025-09-11 21:19:58 +02:00

View Raw