llama.cpp/ggml/src/ggml-cpu at 307772fcda771c0bff42e312d090addf445c1509 - llama.cpp - Gitea - Peisong Xiao

CS348Project/llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-16 11:27:03 +00:00

Files

History

Alberto Cabrera Pérez becc4816dd ggml-cpu: handle 3d tensors in repack mat_mul (#17241 )

* ggml-cpu: handle 3d tensors in repack mul_mat

* Removed unnecessary branch, removed need for <algorithm>

* Fixed dst_ptr pointer in chunk + clang_format

* GGML_ASSERT to check wdata within bounds

* Accidental ggml.h inclusion

* Improved GGML_ASSERT on wdata boundaries

* Address performance regression in Qwen and llama.cpp due to chunking

2025-11-13 12:53:00 -08:00

..

ggml : fix unaligned access in AMX code (#16315 )

2025-10-06 16:05:27 +03:00

arm64: add i8mm route with SVE ggml_vec_dot_q4_K_q8_K and ggml_vec_dot_q6_K_… (#15277 )

2025-11-10 15:12:59 +02:00

ggml : build backends as libraries (#10256 )

2024-11-14 18:04:35 +01:00

kleidiai: add optimized per-channel kernels for Q8_0 (#16993 )

2025-11-11 13:20:31 +02:00

llamafile: PowerPC Sgemm Optimization (#15558 )

2025-08-26 23:35:25 +08:00

ggml : fix SpaceMit IME array out-of-bounds in task assignment (#16629 )

2025-10-17 13:01:23 +03:00

arch-fallback.h

ggml-cpu: implement MXFP4 SIMD for s390x (#16193 )

2025-09-26 13:27:25 +03:00

binary-ops.cpp

cpu: de-duplicate some of the operators and refactor (ggml/1144)

2025-03-30 08:33:31 +03:00

binary-ops.h

cpu: de-duplicate some of the operators and refactor (ggml/1144)

2025-03-30 08:33:31 +03:00

CMakeLists.txt

kleidiai: add optimized per-channel kernels for Q8_0 (#16993 )

2025-11-11 13:20:31 +02:00

common.h

ggml : refactor forward_dup for cpu backend (#16062 )

2025-09-19 06:31:56 +02:00

ggml-cpu-impl.h

ggml : LoongArch fixes (#16958 )

2025-11-03 08:40:02 +02:00

ggml-cpu.c

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00

ggml-cpu.cpp

ggml: riscv: add riscv spacemit backend (#15288 )

2025-09-29 17:50:44 +03:00

hbm.cpp

ggml-cpu : split arch-specific implementations (#13892 )

2025-06-09 16:47:13 +02:00

hbm.h

ggml-cpu : split arch-specific implementations (#13892 )

2025-06-09 16:47:13 +02:00

ops.cpp

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00

ops.h

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00

quants.c

llama : add gpt-oss (#15091 )

2025-08-05 22:10:36 +03:00

quants.h

llama : add gpt-oss (#15091 )

2025-08-05 22:10:36 +03:00

repack.cpp

ggml-cpu: handle 3d tensors in repack mat_mul (#17241 )

2025-11-13 12:53:00 -08:00

repack.h

ggml : repack block_iq4_nlx8 (#14904 )

2025-08-13 11:09:39 +03:00

simd-mappings.h

ggml : LoongArch fixes (#16958 )

2025-11-03 08:40:02 +02:00

traits.cpp

ggml : fix fallback to CPU for ununsupported ops (#15118 )

2025-08-06 14:37:35 +02:00

traits.h

ggml : fix fallback to CPU for ununsupported ops (#15118 )

2025-08-06 14:37:35 +02:00

unary-ops.cpp

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00

unary-ops.h

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00

vec.cpp

ggml-cpu : add RISC-V vector intrinsic support for silu and cvar operations (#17227 )

2025-11-13 13:13:32 +01:00

vec.h

ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063 )

2025-11-13 20:54:47 +02:00