Famework : Pytorch để build model ,Selenium để craw data từ trang web : thivien.net
API : FastAPI FRONT END : Streamlit
Model: xây dựng khối decoder của Transfomers từ đầu,sử dụng Pytorch
Đề xuất một cách có độ chính xác cao hơn: với những mô hình kiểu text generation như thế này thì mình fine turning với những model dạng như gpt2-vietnamese ở HuggingFace sẽ cho hiệu quả rất tốt
1.Setup môi trường:
pip install -r requirements.txt
2.Chạy app.py bằng cách nhấn Run with new Terminal
3.Chạy frontend.py với dòng code:
python -m streamlit run frontend.py