ChatGLM3-6B，增量预训练后，导出独立模型，再使用SFT-LoRA微调报错 #1399

Fire-Star · 2023-11-06T06:22:28Z

增量预训练脚本：

accelerate launch src/train_bash.py \
    --stage pt \
    --model_name_or_path /home/llm/models/ChatGLM3-6B \
    --do_train \
    --dataset 员工手册泛文本 \
    --finetuning_type lora \
    --lora_target query_key_value \
    --output_dir path_to_pt_checkpoint \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate 5e-5 \
    --num_train_epochs 1000.0 \
    --plot_loss \
    --fp16

导出预训练为独立模型：

python src/export_model.py \
    --model_name_or_path /home/llm/models/ChatGLM3-6B \
    --template chatglm3 \
    --finetuning_type lora \
    --checkpoint_dir /home/llm/pretrain/LLaMA-Factory/path_to_pt_checkpoint_员工手册_chat_glm3-6b \
    --export_dir /home/llm/models/ChatGLM3-6B-yuangong_shouce-pretrain

微调脚本：

accelerate launch src/train_bash.py \
    --stage sft \
    --model_name_or_path /home/llm/models/ChatGLM3-6B-yuangong_shouce-pretrain \
    --do_train \
    --dataset 员工手册SFT_LoRA_alpaca \
    --template chatglm3\
    --finetuning_type lora \
    --lora_target query_key_value \
    --output_dir path_to_sft_checkpoint \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate 5e-5 \
    --num_train_epochs 200.0 \
    --plot_loss \
    --fp16

报错信息：

Traceback (most recent call last):
  File "/home/llm/pretrain/LLaMA-Factory/src/train_bash.py", line 14, in <module>
    main()
  File "/home/llm/pretrain/LLaMA-Factory/src/train_bash.py", line 5, in main
    run_exp()
  File "/home/llm/pretrain/LLaMA-Factory/src/llmtuner/tuner/tune.py", line 26, in run_exp
    run_sft(model_args, data_args, training_args, finetuning_args, generating_args, callbacks)
  File "/home/llm/pretrain/LLaMA-Factory/src/llmtuner/tuner/sft/workflow.py", line 28, in run_sft
    model, tokenizer = load_model_and_tokenizer(model_args, finetuning_args, training_args.do_train, stage="sft")
  File "/home/llm/pretrain/LLaMA-Factory/src/llmtuner/tuner/core/loader.py", line 71, in load_model_and_tokenizer
    tokenizer = AutoTokenizer.from_pretrained(
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/models/auto/tokenization_auto.py", line 738, in from_pretrained
    return tokenizer_class.from_pretrained(pretrained_model_name_or_path, *inputs, **kwargs)
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/tokenization_utils_base.py", line 2017, in from_pretrained
    return cls._from_pretrained(
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/tokenization_utils_base.py", line 2249, in _from_pretrained
    tokenizer = cls(*init_inputs, **init_kwargs)
  File "/home/bjkj3/.cache/huggingface/modules/transformers_modules/ChatGLM3-6B-yuangong_shouce-pretrain/tokenization_chatglm.py", line 93, in __init__
    super().__init__(padding_side=padding_side, clean_up_tokenization_spaces=clean_up_tokenization_spaces, **kwargs)
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/tokenization_utils.py", line 363, in __init__
    super().__init__(**kwargs)
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/tokenization_utils_base.py", line 1604, in __init__
    super().__init__(**kwargs)
  File "/home/bjkj3/miniconda3/envs/py39-lora-torch_2.0.1/lib/python3.9/site-packages/transformers/tokenization_utils_base.py", line 861, in __init__
    setattr(self, key, value)
AttributeError: can't set attribute

The text was updated successfully, but these errors were encountered:

hiyouga · 2023-11-06T06:25:40Z

#1307 (comment)

Fire-Star · 2023-11-06T06:42:14Z

已解决，大大太强了

hiyouga added the duplicate This issue or pull request already exists label Nov 6, 2023

hiyouga closed this as completed Nov 6, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ChatGLM3-6B，增量预训练后，导出独立模型，再使用SFT-LoRA微调报错 #1399

ChatGLM3-6B，增量预训练后，导出独立模型，再使用SFT-LoRA微调报错 #1399

Fire-Star commented Nov 6, 2023 •

edited

Loading

hiyouga commented Nov 6, 2023

Fire-Star commented Nov 6, 2023

ChatGLM3-6B，增量预训练后，导出独立模型，再使用SFT-LoRA微调报错 #1399

ChatGLM3-6B，增量预训练后，导出独立模型，再使用SFT-LoRA微调报错 #1399

Comments

Fire-Star commented Nov 6, 2023 • edited Loading

hiyouga commented Nov 6, 2023

Fire-Star commented Nov 6, 2023

Fire-Star commented Nov 6, 2023 •

edited

Loading