这里是阿木实验室和CSR团队共同组建的综合大模型软件(由于项目调整,项目废弃,所以公开该项目)
主要构成有,暂定框架:
│ pdf_to_json.py # 将pdf文件拆分,并喂给chatglm
│ README.md
│ requirements.txt
│
├─bloom # bloom模型所在位置
│ __init__.py
│
├─extra_tools # 其他常用的数据生成软件
│ __init__.py
│ chatglm-prompt.py # 初版的chatgpt训练prompt
│ auto-dataset-generate-by-chatgpt #通用数据集构建
│
├─langchain # langchain,用于加载数据库
│ __init__.py
│
├─chatglm # chatglm模型所在位置,由于版权问题,不会维护这部分内容
│ __init__.py
│
├─function # 通用功能函数,与模型输入对接
│ fuction_utils.py # 函数调用,其他fuction可以直接调用这个函数
│ web_search.py # 网络检索功能
│ __init__.py
│
├─gui_bridge # 该模型和阿木官网对接的插件渠道,暂时不用写
│ __init__.py
│
├─llm_bridge # 连接各个模型和调用的插件渠道
│ bridge_bloom.py # 与其他llm大模型的桥梁
│ bridge_chatgpt.py # 与chatgpt的桥梁
│ llm_bridge_all.py # 所有大模型与上级的接口
│ token_calculate.py # token一些计算原则
│ __init__.py
│
├─model_all # 本地模型存放位置
│ __init__.py
│
├─tools # 通用工具函数,主要用于处理文件信息与可视化
│ color.py # 颜色信息
│ config.py # 配置文件
│ core_functional.py # 动态更新prompt
│ check_proxy.py # 检查代理状态
│ file_conversion.py # 文件转换
│ get_confs.py # 配置文件读取信息
│ __init__.py
│
├─web #运行模型的前后端代码样例
│ chat_web.py #后端demo
│ thread_test_new.py #后端测试工具
│ client.js #前端demo
│
Chatglm系列(目前已经支持商用,可恢复):
https://github.com/ssbuild/chatglm_finetuning
https://github.com/binary-husky/gpt_academic
https://github.com/GaiZhenbiao/ChuanhuChatGPT/tree/main
https://github.com/liangwq/Chatglm_lora_multi-gpu
https://github.com/hiyouga/ChatGLM-Efficient-Tuning
https://github.com/THUDM/ChatGLM2-6B
LLAMA系列:
https://github.com/project-baize/baize-chatbot
https://github.com/hiyouga/LLaMA-Efficient-Tuning
https://github.com/baichuan-inc/Baichuan-13B
https://github.com/FlagAlpha/Llama2-Chinese
https://github.com/michael-wzhu/Chinese-LlaMA2
Bloom系列:
https://github.com/LianjiaTech/BELLE
https://github.com/yangjianxin1/Firefly
https://github.com/yuanzhoulvpi2017/zero_nlp/tree/main/chinese_bloom
https://github.com/zejunwang1/bloom_tuning
加速:
https://github.com/ztxz16/fastllm
常用数据项目:
https://github.com/lonePatient/awesome-pretrained-chinese-nlp-models
https://github.com/chenking2020/FindTheChatGPTer
https://github.com/shibing624/MedicalGPT
https://github.com/carbonz0/alpaca-chinese-dataset
https://github.com/hikariming/alpaca_chinese_dataset
https://github.com/TigerResearch/TigerBot
https://zhuanlan.zhihu.com/p/609172950
扩展工具:
https://github.com/SupritYoung/RLHF-Label-Tool
https://github.com/mMrBun/dataset-generate-by-gpt3.5-python