metal : bf16 workaround (tmp)

2025-10-27 08:21:30 +00:00 · 2025-10-24 13:38:11 +03:00
parent 8af562e83e
commit 9fce24472f
1 changed files with 9 additions and 0 deletions
--- a/ggml/src/ggml-metal/ggml-metal-device.m
+++ b/ggml/src/ggml-metal/ggml-metal-device.m
@@ -474,12 +474,21 @@ ggml_metal_device_t ggml_metal_device_init(void) {

            dev->props.has_bfloat  = [dev->mtl_device supportsFamily:MTLGPUFamilyMetal3_GGML];
            dev->props.has_bfloat |= [dev->mtl_device supportsFamily:MTLGPUFamilyApple6];
+            if (getenv("GGML_METAL_BF16_DISABLE") != NULL) {
+                dev->props.has_bfloat = false;
+            }

            dev->props.has_tensor = [dev->mtl_device supportsFamily:MTLGPUFamilyMetal4_GGML];
            if (getenv("GGML_METAL_TENSOR_DISABLE") != NULL) {
                dev->props.has_tensor = false;
            }

+            // TODO: tmp until figure out how to handle https://github.com/ggml-org/llama.cpp/pull/16634#issuecomment-3441726885
+            if (dev->props.has_tensor && dev->props.has_bfloat) {
+                GGML_LOG_WARN("%s: disabling bfloat support as a workaround for tensor API incompatibility\n", __func__);
+                dev->props.has_bfloat = false;
+            }
+
            dev->props.use_residency_sets = true;
 #if defined(GGML_METAL_HAS_RESIDENCY_SETS)
            dev->props.use_residency_sets = getenv("GGML_METAL_NO_RESIDENCY") == nil;