mirror of https://github.com/google/gemma.cpp.git
parent
338cd8a36e
commit
506fb22be7
|
|
@ -83,6 +83,7 @@ static inline bool EnumValid(LayerAttentionType type) {
|
||||||
enum class AttentionImpl {
|
enum class AttentionImpl {
|
||||||
kOld,
|
kOld,
|
||||||
kFlash,
|
kFlash,
|
||||||
|
kSentinel,
|
||||||
};
|
};
|
||||||
|
|
||||||
AttentionImpl GetAttentionImpl(const std::string& impl);
|
AttentionImpl GetAttentionImpl(const std::string& impl);
|
||||||
|
|
|
||||||
|
|
@ -1,5 +1,6 @@
|
||||||
#include "gemma/kv_cache.h"
|
#include "gemma/kv_cache.h"
|
||||||
|
|
||||||
|
#include <cstddef>
|
||||||
#include <vector>
|
#include <vector>
|
||||||
|
|
||||||
#include "gtest/gtest.h"
|
#include "gtest/gtest.h"
|
||||||
|
|
|
||||||
Loading…
Reference in New Issue