llama.cpp

History

Johannes Gäßler 5143fa895e CUDA: fastdiv, launch bounds for mmvq + q8_1 quant (#15802 ) * CUDA: fastdiv, launch bounds for mmvq + q8_1 quant		2025-09-05 16:07:02 +02:00
..
cmake	ggml: Skip backend library linking code when GGML_BACKEND_DL=ON (#15094 )	2025-08-07 13:45:41 +02:00
include	ggml: add ops for WAN video model (cuda && cpu) (#15669 )	2025-09-04 10:38:49 +02:00
src	CUDA: fastdiv, launch bounds for mmvq + q8_1 quant (#15802 )	2025-09-05 16:07:02 +02:00
.gitignore	vulkan : cmake integration (#8119 )	2024-07-13 18:12:39 +02:00
CMakeLists.txt	ggml-cpu : optimize RVV kernels (#15720 )	2025-09-03 16:16:21 +08:00