vulkan: support softmax/FA batch and broadcast (#14449)

2025-11-01 09:01:57 +00:00 · 2025-07-01 03:32:56 -05:00
parent ec68e84c32
commit 8875523eb3
7 changed files with 80 additions and 44 deletions
--- a/ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_base.comp
+++ b/ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_base.comp
@@ -24,6 +24,7 @@ layout (push_constant) uniform parameter {
    uint32_t nev2;
    uint32_t nev3;
    uint32_t nem1;
+    uint32_t nem2;

    uint32_t nb01;
    uint32_t nb02;
@@ -34,7 +35,6 @@ layout (push_constant) uniform parameter {
    uint32_t nb21;
    uint32_t nb22;
    uint32_t nb23;
-    uint32_t nb31;

    float scale;
    float max_bias;