本项目代码采用双LSTM编码器基于Ubuntu对话语料实现了一款智能聊天机器人 参考2016年ACL专门研究对话的专题会议--SIGDIAL上的一篇论文: The Ubuntu Dialogue Corpus: A Large Dataset for Research in Unstructured Multi-Turn Dialogue Systems.
代码使用 Python 3 + Tensorflow >= 0.9. 运行本代码需要安装以下 packages:
pip install -U pip
pip install numpy scikit-learn pandas jupyter
下载数据集 train/dev/test data here and 并拷贝至项目路径 ./data
.
python udc_train.py
python udc_test.py --model_dir=...
python udc_predict.py --model_dir=...