int8量化感知训练，保存的模型依然是fp32 #27

jinmin527 · 2023-08-27T12:01:02Z

通过BMCook进行模型压缩，配置了quantization和distillation，训练的loss收敛的很好。但是保存模型的时候，发现保存的checkpoint文件并没有减少，分析发现线性层的参数还是fp32的。
另外bmtrain的优化器AdamOffloadOptimizer和AdamOptimizer也只支持参数保存为fp32和fp16，并没有实现参数保存为int8。

jinmin527 · 2023-08-28T05:38:54Z

是不是推理的时候，bminf将线程层转换成量化线性层，最终实现参数从fp16到int8，然后bminf计算也是int8

zzy14 · 2023-08-29T06:27:51Z

是不是推理的时候，bminf将线程层转换成量化线性层，最终实现参数从fp16到int8，然后bminf计算也是int8

是的，保存的精度没有变化，需要再面向bminf转换一下。

zzdxjtu · 2023-11-09T03:36:58Z

@jinmin527 你好，想问问你是怎么量化保存的，我是在微调训练的get_model之后添加的BMQuant.quantize(model, quantization_config)进行量化，能够保存模型，但是加载该模型推理时报了ValueError: Missing some parameters in layer 1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

int8量化感知训练，保存的模型依然是fp32 #27

int8量化感知训练，保存的模型依然是fp32 #27

jinmin527 commented Aug 27, 2023

jinmin527 commented Aug 28, 2023

zzy14 commented Aug 29, 2023

zzdxjtu commented Nov 9, 2023

int8量化感知训练，保存的模型依然是fp32 #27

int8量化感知训练，保存的模型依然是fp32 #27

Comments

jinmin527 commented Aug 27, 2023

jinmin527 commented Aug 28, 2023

zzy14 commented Aug 29, 2023

zzdxjtu commented Nov 9, 2023