llama.cpp/ggml_vk_generate_shaders.py at 30e70334f71b3bd115024affcf98cac3d79aaa95

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-31 08:51:55 +00:00

Files

0cc4m befddd0f15 Vulkan Bugfixes and Improvements (#7084 )

* Modify mat mat mul shader for mul_mat_id, modify mat vec mul shaders for single call batch operation

* Further work towards MoE, disabled for now

* Disable MoE code (not ready yet), fix a number of bugs in shaders and Vulkan code

* Add softmax with f16 mask and pos buffer support

* Disable mul_mat_id shaders for now

* Fix flake8

* Fix validation errors caused by empty buffers on larger batch sizes

2024-05-09 20:39:54 +02:00

124 KiB

Raw Blame History

View Raw

124 KiB Raw Blame History

124 KiB

Raw Blame History