lora微调以后合并使用vllm输出停不下来 #1061

bchengwang · 2024-03-29T10:40:17Z

bchengwang
Mar 29, 2024

lora微调以后合并使用vllm输出停不下来。各位老师有没有遇到过啊？有什么解决办法吗

Answered by zRzRzRzRzRzRzR

这个应该是没有指定special token，使用chattemplate就行了

luowei-D · 2024-04-18T02:43:55Z

在直接使用大模型的情况下也会出现输出不会停止，进入死循环的情况，会拖慢整体大模型的响应速度

0 replies

zRzRzRzRzRzRzR · 2024-05-02T09:37:52Z

这个应该是没有指定special token，使用chattemplate就行了

0 replies