llama.cpp/gguf-py/gguf/quants.py at 0d5a470223fc90b6b6807921d68011ff06ae7f9e

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-02 09:12:03 +00:00

Files

compilade e54d41befc gguf-py : add Numpy MXFP4 de/quantization support (#15111 )

* gguf-py : add MXFP4 de/quantization support

* ggml-quants : handle zero amax for MXFP4

2025-08-08 17:48:26 -04:00

View Raw