llama.cpp/ggml_vk_generate_shaders.py at 917dc8cfa67a72fb7c8bf7392270da3bf4833af4

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-10-30 08:42:00 +00:00

Files

0cc4m f030ec1f7a Vulkan Embedding Fix (#7360 )

* Fix empty Vulkan host buffers

Add fp32 fp16 matmul shader

Fix matmul shader alignment

* Remove deprecated tensor->backend uses

* Fix Vulkan validation errors on embedding models with no offloaded layers

* Fix Vulkan llava segfault when not offloading layers

2024-05-19 17:19:53 +02:00

125 KiB

Raw Blame History

View Raw

125 KiB Raw Blame History

125 KiB

Raw Blame History