Skip to content

Latest commit

 

History

History
38 lines (30 loc) · 2.7 KB

File metadata and controls

38 lines (30 loc) · 2.7 KB
Logo Bootcamp

Santander Bootcamp 2023
Ciência de Dados com Python

Logo Bootcamp

🧠 Desafio Original DIO: Explorando IA Generativa em um Pipeline de ETL com Python

Notebook do desafio original resolvido pelo Venilton da DIO: Open In Colab

🚀 Entendendo o desafio

Inspirado pelo projeto modelo o aluno deveria replicar ou reimaginar uma pipeline ETL utilizando Python.

📊 Meu projeto 🤽‍♂️🚴‍♀️🏄⚽🏈

Imaginando uma loja de produtos esportivos meu desafio foi criar um pipeline ETL para extrair dados de vendas de um arquivo CSV, realizar algumas transformações simples como cálculo de total de vendas por produto e por período e por fim realizar carregamento dos dados transformados em um novo arquivo CSV além de criar uma visualização em tela para mostrar o resultados por meio de gráficos.

🧑‍💻 Etapas do Pipeline de ETL

✅ Extract

Nesta etapa vamos extrair os dados de vendas do arquivo dados-venda.csv. Este arquivo traz informações referentes ao ano de 2023 considerando o período de janeiro a agosto. As colunas contidas no arquivo são as seguintes: Produto, Data, Quantidade e Valor.

✅ Transform

Agora vamos calcular o total de vendas por produto e por mês.

✅ Load

Salvando os dados transformados em um novo arquivo CSV e gerando gráfico de barras e de linha usando a biblioteca Matplotlib

🔋 Stack utilizada

VSCODE PYTHON GIT GOOGLE COLAB

📔 Notebook do meu projeto no Google Colab

Open In Colab