ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了FlashAttention和Multi-Query Attention等新特性。更详细的模型介绍见ChatGLM2-6B GitHub
支持模型权重:
Model |
---|
THUDM/chatglm2-6b |
THUDM/chatglm3-6b |
ChatGLM2-6B 模型的权重的使用需要遵循License。
请参考LLM全流程工具介绍