-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Lora和QLora是否支持多卡训练? #2
Comments
使用 torchrun 可以开启多卡训练 |
Lora微调bloom,如果不开启int8_training,会报错如下,但是如果设置int8_training为True,则能正常运行 |
在不开启 int8_training 下,你在训练前加上 model.enable_input_require_grads() 试试 |
能跑起来的话留言告诉我一下 |
加上 model.enable_input_require_grads() 之后,不开启int8 training可以跑了,thx! |
还有现在的train_lora.py数据集直接通过DataCollator加载,对于单轮指令对话是不是不适用?我理解算Loss的时候应该只算response的loss,不计算human中问题或指令的Loss |
单轮对话指令需要处理成如下格式: {
"conversation_id": 4,
"category": "Brainstorming",
"num_turns": 1,
"conversation": [
{
"human": "如何制定一个有效的网页设计?",
"assistant": "\n\n要制定一个有效的网页设计,需要考虑以下几个方面:\n\n1. 目标受众:确定您的目标受众是谁,这将有助于您决定网站的设计和内容。\n\n2. 清晰的布局:网站的布局应该简单,易于使用和导航。所有元素应该有明确的标识和位置,以便用户快速找到他们需要的信息。\n\n3. 吸引人的视觉效果:网站的设计应该吸引人,使用清晰的图像、颜色和字体。但同时也要确保视觉效果不会影响网站的性能和导航。\n\n4. 有效的内容:网站的内容应该有价值,易于理解和使用。使用简单的语言和段落,避免使用过于复杂的术语和语言。\n\n5. 可访问性:网站应该易于访问,即使是对于有视觉或听力障碍的用户。确保网站符合标准的可访问性要求。\n\n6. 响应式设计:网站应该是响应式的,即适合各种不同尺寸的设备。这将确保用户在不同设备上都能够访问和使用您的网站。\n\n通过考虑这些方面,您可以制定一个有效的网页设计,吸引并留住您的受众,并提高您的网站的成功率。"
}
]
} |
两个训练的参数量差别大吗? |
谢谢,已解决,之前测算有误,bloom和llama微调没有数量级的速度差别 |
微调BLOOM,使用Lora或QLora,是否支持多卡训练?
The text was updated successfully, but these errors were encountered: