llama.cpp

History

Junwon Hwang 60591f01d4 model : add EXAONE MoE (#18543 ) * Add EXAONE MoE implementations Co-authored-by: Junwon Hwang <nuclear1221@gmail.com> * Address PR feedback * Address PR feedback * [WIP] Add MTP for EXAONE-MoE * Address PR feedback * Address PR feedback * Address PR feedback * Address PR feedback * Address PR feedback * Address PR feedback * Address PR feedback --------- Co-authored-by: LG-AI-EXAONE <exaonemodels@lgresearch.ai>		2026-01-13 23:28:38 +01:00
..
scripts	gguf-py : fix passing non-native endian tensors (editor-gui and new-metadata) (#17553 )	2025-11-28 20:53:01 +01:00
__init__.py	…
constants.py	model : add EXAONE MoE (#18543 )	2026-01-13 23:28:38 +01:00
gguf.py	…
gguf_reader.py	…
gguf_writer.py	mtmd: Add Gemma3n multimodal support with MobileNetV5 vision encoder (#18256 )	2026-01-09 23:42:38 +01:00
lazy.py	…
metadata.py	llama: introduce support for model-embedded sampling parameters (#17120 )	2025-11-25 09:56:07 +08:00
py.typed	…
quants.py	…
tensor_mapping.py	model : add EXAONE MoE (#18543 )	2026-01-13 23:28:38 +01:00
utility.py	gguf-py : do not align the data start offset (#18291 )	2025-12-22 20:25:16 +01:00
vocab.py	convert : support latest mistral-common (fix conversion with --mistral-format) (#17712 )	2025-12-03 21:15:04 +01:00