support reversed role

Judd · Judd · commit 61c46516c153 · 2024-12-19T17:07:13.000+08:00
diff --git a/models/cohere.cpp b/models/cohere.cpp
@@ -14,6 +14,7 @@ class ChatHistoryEncoder : public BaseHistoryEncoder
     void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
     void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
     void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+    void append_user_opening(int round_idx, std::vector<int> &ids) const override;
 };
 
 static ChatHistoryEncoder _chat_encoder;
@@ -166,6 +167,14 @@ void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids)
     ids.push_back(tok->chatbot_token_id);
 }
 
+void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+{
+    Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+
+    ids.push_back(tok->start_of_turn_token_id);
+    ids.push_back(tok->user_token_id);
+}
+
 }
 
 namespace aya_23
diff --git a/models/gemma.cpp b/models/gemma.cpp
@@ -14,6 +14,7 @@ class ChatHistoryEncoder : public BaseHistoryEncoder
     void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
     void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
     void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+    void append_user_opening(int round_idx, std::vector<int> &ids) const override;
 };
 
 static ChatHistoryEncoder _chat_encoder;
@@ -153,10 +154,13 @@ void ChatHistoryEncoder::append_user(int round_idx, const std::string &user, std
 void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids) const
 {
     Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
-    std::ostringstream oss_prompt;
+    tok->encode("model\n", ids, true, false);
+}
 
-    oss_prompt << "model" << "\n";
-    tok->encode(oss_prompt.str(), ids, true, false);
+void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+{
+    Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+    tok->encode("user\n", ids, true, false);
 }
 }
 
diff --git a/models/granite.cpp b/models/granite.cpp
@@ -21,6 +21,7 @@ namespace moe
         void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
         void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
         void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+        void append_user_opening(int round_idx, std::vector<int> &ids) const override;
     };
 
     static ChatHistoryEncoder _chat_encoder;
@@ -110,11 +111,15 @@ namespace moe
     void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids) const
     {
         Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
-        std::ostringstream oss;
-
         tok->encode_header("assistant", ids);
     }
 
+    void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+    {
+        Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+        tok->encode_header("user", ids);
+    }
+
     template <int NUM_EXPERTS, int EXPERTS_PER_TOK> class GraniteSparseMoE : public BaseSparseMLP
     {
     public:
diff --git a/models/llama.cpp b/models/llama.cpp
@@ -224,6 +224,7 @@ namespace v3
         void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
         void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
         void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+        void append_user_opening(int round_idx, std::vector<int> &ids) const override;
     };
 
     static ChatHistoryEncoder _chat_encoder;
@@ -322,11 +323,15 @@ namespace v3
     void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids) const
     {
         Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
-        std::ostringstream oss;
-
         tok->encode_header("assistant", ids);
     }
 
+    void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+    {
+        Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+        tok->encode_header("user", ids);
+    }
+
     class ConditionalGeneration : public v2::GenericConditionalGeneration<LlamaBlock>
     {
     public:
diff --git a/models/minicpm.cpp b/models/minicpm.cpp
@@ -160,6 +160,7 @@ namespace v2
         void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
         void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
         void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+        void append_user_opening(int round_idx, std::vector<int> &ids) const override;
     };
 
     static ChatHistoryEncoder _chat_encoder;
@@ -249,11 +250,13 @@ namespace v2
     void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids) const
     {
         Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+        tok->encode("assistant\n", ids, true, false);
+    }
 
-        std::ostringstream oss_prompt;
-
-        oss_prompt << "assistant\n";
-        tok->encode(oss_prompt.str(), ids, true, false);
+    void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+    {
+        Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+        tok->encode("user\n", ids, true, false);
     }
 }
 
diff --git a/models/smollm.cpp b/models/smollm.cpp
@@ -7,6 +7,7 @@ class ChatHistoryEncoder : public BaseHistoryEncoder
     void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
     void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
     void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+    void append_user_opening(int round_idx, std::vector<int> &ids) const override;
 };
 
 static ChatHistoryEncoder _chat_encoder;
@@ -71,6 +72,13 @@ void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids)
     tok->encode("assistant\n", ids);
 }
 
+void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+{
+    Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+    ids.push_back(tok->bos_token_id);
+    tok->encode("user\n", ids);
+}
+
 class ConditionalGeneration : public llama::v2::GenericConditionalGeneration<LlamaBlock>
 {
 public:
diff --git a/models/yi.cpp b/models/yi.cpp
@@ -12,6 +12,7 @@ class ChatHistoryEncoder : public BaseHistoryEncoder
     void append_ai(int round_idx, const std::string &ai, std::vector<int> &ids) const override;
     void append_user(int round_idx, const std::string &user, std::vector<int> &ids) const override;
     void append_ai_opening(int round_idx, std::vector<int> &ids) const override;
+    void append_user_opening(int round_idx, std::vector<int> &ids) const override;
 };
 
 static ChatHistoryEncoder _chat_encoder;
@@ -102,6 +103,14 @@ void ChatHistoryEncoder::append_ai_opening(int round_idx, std::vector<int> &ids)
     tok->encode("assistant\n", ids);
 }
 
+void ChatHistoryEncoder::append_user_opening(int round_idx, std::vector<int> &ids) const
+{
+    Tokenizer *tok = dynamic_cast<Tokenizer *>(tokenizer);
+
+    ids.push_back(tok->im_start_token_id);
+    tok->encode("user\n", ids);
+}
+
 bool Tokenizer::is_special_id(int id) const
 {
     return llama::v2::Tokenizer::is_special_id(id)