kleidiai: add optimized per-channel kernels for Q8_0 (#16993)

2025-11-13 10:57:15 +00:00 · 2025-11-11 12:20:31 +01:00
parent 4a5b8aff40
commit 8c583242ad
4 changed files with 538 additions and 41 deletions
--- a/ggml/src/ggml-cpu/kleidiai/kernels.h
+++ b/ggml/src/ggml-cpu/kleidiai/kernels.h
@@ -87,3 +87,4 @@ struct ggml_kleidiai_kernels {

 ggml_kleidiai_kernels * ggml_kleidiai_select_kernels(cpu_feature cpu_features, const ggml_tensor * tensor);
 ggml_kleidiai_kernels * ggml_kleidiai_select_kernels_q4_0(cpu_feature features);
+ggml_kleidiai_kernels * ggml_kleidiai_select_kernels_q8_0(cpu_feature features);