llama.cpp

History

Aleksander Grygier 6018f85c65 feat: Architectural improvements		2026-01-22 18:19:37 +01:00
..
batched-bench	…
cli	server: update docs for sleeping [no ci] (#18777 )	2026-01-12 13:01:24 +01:00
completion	server: update docs for sleeping [no ci] (#18777 )	2026-01-12 13:01:24 +01:00
cvector-generator	…
export-lora	…
fit-params	llama-fit-params: free memory target per device (#18679 )	2026-01-08 10:07:58 +01:00
gguf-split	…
imatrix	…
llama-bench	llama-bench: add direct_io parameter (#18778 )	2026-01-13 08:49:10 +01:00
mtmd	mtmd: fix use_non_causal being reported incorrectly (#18793 )	2026-01-13 12:19:38 +01:00
perplexity	…
quantize	quantize: prevent input/output file collision (#18451 )	2025-12-31 23:29:03 +08:00
rpc	…
server	feat: Architectural improvements	2026-01-22 18:19:37 +01:00
tokenize	…
tts	…
CMakeLists.txt	cmake: only build cli when server is enabled (#18670 )	2026-01-09 16:43:26 +01:00