cleanup load

foldl · foldl · commit 8931c4d75513 · 2025-04-30T15:51:28.000+08:00
diff --git a/models/baichuan.cpp b/models/baichuan.cpp
@@ -322,6 +322,13 @@ namespace m1
             conv_v.set_id(id);
         }
 
+        void load(const std::string &path, TensorLoader *loader) override
+        {
+            BaseAttn::load(path, loader);
+            conv_k.load(path + "conv_k", loader);
+            conv_v.load(path + "conv_v", loader);
+        }
+
     public:
         FIR2 conv_k;
         FIR2 conv_v;
@@ -404,44 +411,6 @@ namespace m1
             }
         }
 
-        void load(ModelLoader &loader) override
-        {
-            auto transformer = get_typed_transformer<ModelClass>();
-
-            #define LOAD_TENSORS()  \
-                loader.read_tensor(layer_prefix + "input_layernorm.weight", layer->input_layernorm.weight); \
-                loader.read_tensor(layer_prefix + "mlp.down_proj.weight",   layer->mlp.down_proj.weight);   \
-                loader.read_tensor(layer_prefix + "mlp.gate_proj.weight",   layer->mlp.gate_proj.weight);   \
-                loader.read_tensor(layer_prefix + "mlp.up_proj.weight",     layer->mlp.up_proj.weight);     \
-                loader.read_tensor(layer_prefix + "post_attention_layernorm.weight", layer->post_attention_layernorm.weight); \
-                loader.read_tensor(layer_prefix + "self_attn.k_proj.weight", layer->attention.k_proj.weight);         \
-                loader.read_tensor(layer_prefix + "self_attn.o_proj.weight", layer->attention.o_proj.weight);         \
-                loader.read_tensor(layer_prefix + "self_attn.q_proj.weight", layer->attention.q_proj.weight);         \
-                loader.read_tensor(layer_prefix + "self_attn.v_proj.weight", layer->attention.v_proj.weight);         \
-                loader.read_tensor(layer_prefix + "self_attn.conv_k", layer->attention.conv_k.weight);                \
-                loader.read_tensor(layer_prefix + "self_attn.conv_v", layer->attention.conv_v.weight);
-
-            loader.read_tensor("model.embed_tokens.weight", transformer->word_embeddings.weight);
-            for (int i = 0; i < config.num_hidden_layers; i++)
-            {
-                std::string layer_prefix = "model.layers." + std::to_string(layer_ids[i]) + '.';
-                if (is_swa_layer(i))
-                {
-                    auto layer = dynamic_cast<BaiChuanSWABlock8k *>(transformer->get_layer(i));
-                    LOAD_TENSORS();
-                }
-                else
-                {
-                    auto layer = dynamic_cast<BaiChuanFullBlock *>(transformer->get_layer(i));
-                    LOAD_TENSORS();
-                }
-            }
-            loader.read_tensor("model.norm.weight", transformer->final_layernorm.weight);
-            loader.read_tensor("lm_head.weight", dynamic_cast<Linear *>(transformer->lm_head)->weight);
-
-            #undef LOAD_TENSORS
-        }
-
     private:
         bool is_swa_layer(int layer_index) const
         {
diff --git a/models/llama.cpp b/models/llama.cpp
@@ -85,48 +85,6 @@ If a question does not make any sense, or is not factually coherent, explain why
                                                     config.intermediate_size, num_key_value_heads, head_dim, max_length);
         }
 
-        void load(ModelLoader &loader) override
-        {
-            switch (type_class)
-            {
-            case 1:
-                load0<ModelClass>(loader);
-                break;
-            default:
-                load0<ModelClass2>(loader);
-                break;
-            }
-        }
-
-    protected:
-        template <class T> void load0(ModelLoader &loader)
-        {
-            auto transformer = Base::get_typed_transformer<T>();
-            loader.read_tensor("model.embed_tokens.weight", transformer->word_embeddings.weight);
-            for (int i = 0; i < config.num_hidden_layers; i++)
-            {
-                std::string layer_prefix = "model.layers." + std::to_string(Base::layer_ids[i]) + '.';
-                loader.read_tensor(layer_prefix + "input_layernorm.weight", transformer->layers[i].input_layernorm.weight);
-                loader.read_tensor(layer_prefix + "mlp.down_proj.weight", transformer->layers[i].mlp.down_proj.weight);
-                loader.read_tensor(layer_prefix + "mlp.gate_proj.weight", transformer->layers[i].mlp.gate_proj.weight);
-                loader.read_tensor(layer_prefix + "mlp.up_proj.weight", transformer->layers[i].mlp.up_proj.weight);
-                loader.read_tensor(layer_prefix + "post_attention_layernorm.weight", transformer->layers[i].post_attention_layernorm.weight);
-
-                loader.read_tensor(layer_prefix + "self_attn.k_proj.weight", transformer->layers[i].attention.k_proj.weight);
-                loader.read_tensor(layer_prefix + "self_attn.o_proj.weight", transformer->layers[i].attention.o_proj.weight);
-                loader.read_tensor(layer_prefix + "self_attn.q_proj.weight", transformer->layers[i].attention.q_proj.weight);
-                loader.read_tensor(layer_prefix + "self_attn.v_proj.weight", transformer->layers[i].attention.v_proj.weight);
-            }
-            loader.read_tensor("model.norm.weight", transformer->final_layernorm.weight);
-
-            if (transformer->lm_head)
-                loader.read_tensor("lm_head.weight", dynamic_cast<Linear *>(transformer->lm_head)->weight);
-
-            CHATLLM_CHECK(w_ctx_.get_used_mem() == w_ctx_.get_mem_size())
-                << "corrupted model weights: " << w_ctx_.get_used_mem() / ggml_tensor_overhead() << " vs "
-                << w_ctx_.get_mem_size() / ggml_tensor_overhead();
-        }
-
     public:
         BaseConfig config;
 
diff --git a/models/qwen.cpp b/models/qwen.cpp
@@ -266,8 +266,6 @@ namespace v2
     public:
         ConditionalGeneration(const Config &config, const RuntimeConfig &runtime_config, ModelType type = ModelType::MODEL_TYPE_QWEN2, bool tie_embeddings = false);
 
-        void load(ModelLoader &loader) override;
-
     public:
         Config config;
 
@@ -308,37 +306,6 @@ namespace v2
             layer.attention.freq_base = config.rope_theta;
         }
     }
-
-    void ConditionalGeneration::load(ModelLoader &loader)
-    {
-        auto transformer = get_typed_transformer<ModelClass>();
-        loader.read_tensor("model.embed_tokens.weight", transformer->word_embeddings.weight);
-        for (int i = 0; i < config.num_hidden_layers; i++)
-        {
-            std::string layer_prefix = "model.layers." + std::to_string(layer_ids[i]) + '.';
-
-            loader.read_tensor(layer_prefix + "self_attn.k_proj.weight", transformer->layers[i].attention.k_proj.weight);
-            loader.read_tensor(layer_prefix + "self_attn.k_proj.bias",   transformer->layers[i].attention.k_proj.bias);
-            loader.read_tensor(layer_prefix + "self_attn.q_proj.weight", transformer->layers[i].attention.q_proj.weight);
-            loader.read_tensor(layer_prefix + "self_attn.q_proj.bias",   transformer->layers[i].attention.q_proj.bias);
-            loader.read_tensor(layer_prefix + "self_attn.v_proj.weight", transformer->layers[i].attention.v_proj.weight);
-            loader.read_tensor(layer_prefix + "self_attn.v_proj.bias",   transformer->layers[i].attention.v_proj.bias);
-            loader.read_tensor(layer_prefix + "self_attn.o_proj.weight", transformer->layers[i].attention.o_proj.weight);
-
-            loader.read_tensor(layer_prefix + "input_layernorm.weight",          transformer->layers[i].input_layernorm.weight);
-            loader.read_tensor(layer_prefix + "post_attention_layernorm.weight", transformer->layers[i].post_attention_layernorm.weight);
-
-            loader.read_tensor(layer_prefix + "mlp.down_proj.weight", transformer->layers[i].mlp.down_proj.weight);
-            loader.read_tensor(layer_prefix + "mlp.up_proj.weight",   transformer->layers[i].mlp.up_proj.weight);
-            loader.read_tensor(layer_prefix + "mlp.gate_proj.weight", transformer->layers[i].mlp.gate_proj.weight);
-        }
-        loader.read_tensor("model.norm.weight", transformer->final_layernorm.weight);
-        if (!tie_embeddings)
-            loader.read_tensor("lm_head.weight", dynamic_cast<Linear *>(transformer->lm_head)->weight);
-
-        CHATLLM_CHECK(w_ctx_.get_used_mem() == w_ctx_.get_mem_size())
-            << "corrupted model weights";
-    }
 }
 
 namespace v2_tie