gemma.cpp

History

Jan Wassenberg 6ea4232b2e MatMul cleanup: Mat struct, simplify args. Add large benchmark to test, use 4 threads, skip some targets. Also use Traits::Name instead of typeid. PiperOrigin-RevId: 657496185		2024-07-30 01:55:50 -07:00
..
evals	Add MMLU eval to github	2024-05-20 10:20:53 -07:00
instantiations	7x compile time speedup: shard gemma.cc	2024-07-03 06:35:04 -07:00
activations.h	De-templatize Activations, add RowVectorBatch class	2024-07-17 04:38:15 -07:00
common.cc	7x compile time speedup: shard gemma.cc	2024-07-03 06:35:04 -07:00
common.h	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
configs.h	Update gemma-27b to the correct query scaling.	2024-07-17 05:43:52 -07:00
gemma-inl.h	MatMul cleanup: Mat struct, simplify args.	2024-07-30 01:55:50 -07:00
gemma.cc	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
gemma.h	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
kv_cache.cc	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
kv_cache.h	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
run.cc	Major revamp #2 of Prefill: fix token order, parallel for multi-query	2024-07-25 03:28:55 -07:00
tokenizer.cc	7x compile time speedup: shard gemma.cc	2024-07-03 06:35:04 -07:00
tokenizer.h	7x compile time speedup: shard gemma.cc	2024-07-03 06:35:04 -07:00
weights.cc	Add scale parameter to MatMul.	2024-07-18 06:58:56 -07:00
weights.h	Fix msan uninitialized scale in optimize_test	2024-07-22 10:50:25 -07:00