chatbot-dataset 一个 聊天/对话/问答 数据集的索引列表,包含学术评测使用的标准数据集以及从网络上其他地方收集整理的数据集。部分数据可公开访问下载,有些则需要购买或授权 —— 对于前者,本项目将提供直接可用的下载链接,对后者本项目只提供一个索引。 英文数据集 The Stanford Question Answering Dataset(SQuAD) Training Set v1.1(30MB) Dev Set v1.1(5MB) Evaluation Script v1.1 Sample Prediction File(on Dev v1.1) Ubuntu Dialogue Corpus Ubuntu Dialogue Corpus v1.0 Ubuntu Dialogue Corpus v2.0 FAIR: The Movie Dialog dataset Reddit Comment Corpus Microsoft Research Social Media Conversation Corpus Cornell Movie-Dialogs Corpus 中文数据集 dgk_lost_conv 中文对白语料 Noah NRM Data Noah Chinese QA 高质量闲聊语料 百度 WebQA 数据集