通义千问(Qwen) 是阿里云研发的通义千问大模型系列的模型, 有 70 亿和 140 亿两个规模。Qwen是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。
支持模型权重:
Model |
---|
qwen/qwen-7b |
qwen/qwen-7b-chat |
qwen/qwen-14b |
qwen/qwen-14b-chat |
请参考LLM全流程工具介绍
Name | Name | Last commit date | ||
---|---|---|---|---|
parent directory.. | ||||
通义千问(Qwen) 是阿里云研发的通义千问大模型系列的模型, 有 70 亿和 140 亿两个规模。Qwen是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。
支持模型权重:
Model |
---|
qwen/qwen-7b |
qwen/qwen-7b-chat |
qwen/qwen-14b |
qwen/qwen-14b-chat |
请参考LLM全流程工具介绍