llama.cpp/examples/common.h at 2d7bf110edd8c49209401a16132052cba706ffd0

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-11-04 09:32:00 +00:00

Files

Johannes Gäßler 17366df842 Multi GPU support, CUDA refactor, CUDA scratch buffer (#1703 )

* CUDA multi GPU + scratch

ggml_cuda_compute_forward

Tensor parallelism

ggml_cuda_add

ggml_cuda_rms_norm

ggml_cuda_silu

CUDA scratch buffer

--main-gpu CLI option

2023-06-06 21:33:23 +02:00

5.1 KiB

Raw Blame History

View Raw

5.1 KiB Raw Blame History

5.1 KiB

Raw Blame History