Adicionar introdução aqui
Para rodar o projeto, são necessárias as seguintes dependências:
- Python
- PostgreSQL
- PySpark
- Streamlit
- Altair
- vega_datasets
Assumindo que você já tenha Python e o PyPi instalado em sua máquina, instale o PySpark com os seguintes comandos:
pip install pyspark
pip install findspark
pip install streamlit
pip install altair vega_datasets
Atualmente, utilizamos a versão 3.3.0 do PySpark com a versão 2.0.1 do FindSpark.