Este conteúdo é voltado a pessoas com interesse em análise de dados. Serão realizados workflows e análises para resolução de problemas introdutórios, utilizando dados geológicos, seguindo dois passos principais:
-
estruturação e validação de dados com SQL
- criação de um banco de dados e análises com queries SQL; check de qualidade de dados; criação de tabelas tratadas; análise de dados inicial
- SQL, DB Browser SQLite
- criação de um banco de dados e análises com queries SQL; check de qualidade de dados; criação de tabelas tratadas; análise de dados inicial
-
análise exploratória com Python
- gestão do banco de dados e execução de queries; análise exploratória de dados; criação de com visualização de dados
- Python, libs: pandas, seaborn, matplotlib
- gestão do banco de dados e execução de queries; análise exploratória de dados; criação de com visualização de dados
-
modelos lineares
- criação de modelos lineares de regressão utilizando teores
- Python, libs: pandas, seaborn, matplotlib, sklearn
- criação de modelos lineares de regressão utilizando teores
Módulo | Tema | Link |
---|---|---|
1 | Qualidade de Dados e Validação com SQL | link |
2 | Análise Exploratória e Visualização de Dados com Python | link |
3 | Criando modelos lineares com Python | link |
-
Conda e ambientes virtuais
-
Git e Github
-
SQL
-
Python
-
Geoestatística
- VS Code - editor de código
- miniconda - organizador de ambientes virtuais
- github - repositórios remotos para colaboração
- DB Browser for SQLite - gerenciador de databases SQLite
Serão utilizados os seguintes datasets:
-
Jura: dataset retirado do livro de Pierre Goovaerts;
-
Walker Lake: dataset retirado livro de Isaaks & Srivastava
The jura data set from Pierre Goovaerts' book (see references below). It contains four data.frames: prediction.dat, validation.dat and transect.dat and juragrid.dat, and three data.frames with consistently coded land use and rock type factors, as well as geographic coordinates. The examples below show how to transform these into spatial (sp) objects in a local coordinate system and in geographic coordinates, and how to transform to metric coordinate reference systems.