[WIP] hello world example working. TODO: refactor interfaces to decouple arguments

2024-03-03 11:36:48 -05:00 · 2024-03-03 11:36:48 -05:00 · c378ac2c56
parent 39cd59caec
commit c378ac2c56
5 changed files with 83 additions and 37 deletions
--- a/examples/hello_world/CMakeLists.txt
+++ b/examples/hello_world/CMakeLists.txt
@ -14,7 +14,7 @@

 cmake_minimum_required(VERSION 3.11)

-project(look)
+project(hello_world)

 set(CMAKE_CXX_STANDARD 17)
 set(CMAKE_CXX_STANDARD_REQUIRED ON)
@ -34,12 +34,12 @@ if(NOT CMAKE_BUILD_TYPE)
    set(CMAKE_BUILD_TYPE "Release")
 endif()

-add_executable(look run.cc)
-target_sources(look PRIVATE ${SOURCES})
-set_property(TARGET look PROPERTY CXX_STANDARD 17)
-target_link_libraries(look hwy hwy_contrib sentencepiece libgemma)
-target_include_directories(look PRIVATE ./)
+add_executable(hello_world run.cc)
+target_sources(hello_world PRIVATE ${SOURCES})
+set_property(TARGET hello_world PROPERTY CXX_STANDARD 17)
+target_link_libraries(hello_world hwy hwy_contrib sentencepiece libgemma)
+target_include_directories(hello_world PRIVATE ./)
 FetchContent_GetProperties(sentencepiece)
-target_include_directories(look PRIVATE ${sentencepiece_SOURCE_DIR})
-target_compile_definitions(look PRIVATE $<$<PLATFORM_ID:Windows>:_CRT_SECURE_NO_WARNINGS NOMINMAX>)
-target_compile_options(look PRIVATE $<$<PLATFORM_ID:Windows>:-Wno-deprecated-declarations>)
+target_include_directories(hello_world PRIVATE ${sentencepiece_SOURCE_DIR})
+target_compile_definitions(hello_world PRIVATE $<$<PLATFORM_ID:Windows>:_CRT_SECURE_NO_WARNINGS NOMINMAX>)
+target_compile_options(hello_world PRIVATE $<$<PLATFORM_ID:Windows>:-Wno-deprecated-declarations>)
--- a/examples/hello_world/build/.gitignore
+++ b/examples/hello_world/build/.gitignore
--- a/examples/hello_world/run.cc
+++ b/examples/hello_world/run.cc
@ -0,0 +1,74 @@
+#include <iostream>
+
+// copybara:import_next_line:gemma_cpp
+#include "compression/compress.h"
+// copybara:end
+// copybara:import_next_line:gemma_cpp
+#include "gemma.h"  // Gemma
+// copybara:end
+// copybara:import_next_line:gemma_cpp
+#include "util/app.h"
+// copybara:end
+// copybara:import_next_line:gemma_cpp
+#include "util/args.h"  // HasHelp
+// copybara:end
+#include "hwy/base.h"
+#include "hwy/contrib/thread_pool/thread_pool.h"
+#include "hwy/highway.h"
+#include "hwy/per_target.h"
+#include "hwy/profiler.h"
+#include "hwy/timer.h"
+
+std::vector<int> tokenize(std::string prompt_string, const sentencepiece::SentencePieceProcessor& tokenizer) {
+  prompt_string = "<start_of_turn>user\n" + prompt_string +
+                  "<end_of_turn>\n<start_of_turn>model\n";
+  std::vector<int> tokens;
+  HWY_ASSERT(tokenizer.Encode(prompt_string, &tokens).ok());
+  tokens.insert(tokens.begin(), 2); // BOS token
+  return tokens;
+}
+
+int main(int argc, char** argv) {
+  gcpp::InferenceArgs inference(argc, argv);
+  gcpp::LoaderArgs loader(argc, argv);
+  gcpp::AppArgs app(argc, argv);
+  hwy::ThreadPool pool(app.num_threads);
+  hwy::ThreadPool inner_pool(0);
+  gcpp::Gemma model(loader, pool);
+
+  std::vector<int> tokens = tokenize("Hello, how are you?", model.Tokenizer());
+
+  std::mt19937 gen;
+  std::random_device rd;
+  gen.seed(rd());
+
+  size_t ntokens = tokens.size();
+
+  size_t pos = 0;
+
+  auto stream_token = [&pos, &gen, &ntokens, tokenizer = &model.Tokenizer()](int token, float) {
+    ++pos;
+    if (pos < ntokens) {
+      // print feedback
+    } else if (token != gcpp::EOS_ID) {
+      std::string token_text;
+      HWY_ASSERT(tokenizer->Decode(std::vector<int>{token}, &token_text).ok());
+      if (pos == ntokens + 1) {
+        // first token of response
+        token_text.erase(0, token_text.find_first_not_of(" \t\n\n"));
+      }
+      std::cout << token_text << std::flush;
+    }
+    return true;
+  };
+
+  inference.temperature = 1.0f;
+  inference.deterministic = true;
+  inference.multiturn = false;
+
+  GenerateGemma(
+      model, inference, tokens, 0, pool, inner_pool, stream_token,
+      [](int) {return true;}, gen, 0);
+
+  std::cout << std::endl;
+}
--- a/examples/look/run.cc
+++ b/examples/look/run.cc
@ -1,28 +0,0 @@
-#include <iostream>
-
-// copybara:import_next_line:gemma_cpp
-#include "compression/compress.h"
-// copybara:end
-// copybara:import_next_line:gemma_cpp
-#include "gemma.h"  // Gemma
-// copybara:end
-// copybara:import_next_line:gemma_cpp
-#include "util/app.h"
-// copybara:end
-// copybara:import_next_line:gemma_cpp
-#include "util/args.h"  // HasHelp
-// copybara:end
-#include "hwy/base.h"
-#include "hwy/contrib/thread_pool/thread_pool.h"
-#include "hwy/highway.h"
-#include "hwy/per_target.h"
-#include "hwy/profiler.h"
-#include "hwy/timer.h"
-
-int main(int argc, char** argv) {
-  gcpp::LoaderArgs loader(argc, argv);
-  gcpp::AppArgs app(argc, argv);
-  hwy::ThreadPool pool(app.num_threads);
-  gcpp::Gemma model(loader, pool);
-  std::cout << "Done" << std::endl;
-}
--- a/models/.gitignore
+++ b/models/.gitignore