llama.cpp/ggml-quants.c at 182adefcf36fc5f4263082ff032c0796fda65578

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-03 09:22:01 +00:00

Files

Hong Bo PENG 0d26d8ccd8 ggml : optimize for ppc64le using VSX intrinsics (ggml/784)

* optimize for ppc64le using VSX intrinsics

* 1. code clean up by removing comments about overflow concern.

2. fix typo in suffix of scaling.

* Continue to fix typo in suffix of scaling for QK_K <> 256

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

2024-05-14 19:08:09 +03:00

619 KiB

Raw Blame History

View Raw

619 KiB Raw Blame History

619 KiB

Raw Blame History