Após clonar o projeto, seguir as etapas a seguir.
cd diretorio/do/projeto
python -m venv venv
Linha de comando no Windows:
cd diretorio/do/projeto
venv\Scripts\activate
Git bash:
cd diretorio/do/projeto
source venv\Scripts\activate
pip install -r requirements.txt
pip install notebook
Linha de comando no Windows:
cd diretorio/do/projeto
venv\Scripts\activate
Git bash:
cd diretorio/do/projeto
source venv\Scripts\activate
Baixar arquivos tar.gz do portal dadosmg:
make download
Executar script de carga de dados:
make run
Fazer download dos arquivos e executar o script de carga de dados:
make all
Ativar o ambiente virtual:
cd diretorio/do/projeto
source venv\Scripts\activate
Baixar os arquivos csv.gz do portal dadosmg, salvá-los na pasta \datasets e extrair todos os arquivos csv. Após isso abrir o notebook 'dadosmg_basics.ipynb' no jupyter e executar.
NOTA: Durante os testes realizados o kernel do Jupyter se mostrou instável, não conseguindo importar os dados corretamente e reiniciando durante o processo. Logo é recomendado utilizá-lo para consultas e análises, mas no momento não mais para realizar as cargas de dados. O arquivo 'dadosmg_basics.ipynb' contém snippets de manipulações básicas utilizando o DuckDB em python.
A ferramenta open source DB Browser for SQLite pode ser utilizada para visualizar a base de dados do SQLite.