Este repositório é sobre o projeto de teste prático para vaga de Analista Python Júnior da empresa ADVBOX.
O teste consiste em:
- Elaborar um processamento que trará os dados dos arquivos CSV para tabelas;
- Realizar a seleção e tratamento dos dados das tabelas para duas planilhas resultado (CLIENTES e PROCESSOS), garantindo as condições de validação;
- Criar uma interface simples de usuário para que o operador possa subir a base de backup e obter as planilhas correspondentes.
- A coluna NOME é preenchida da seguinte maneira: busca-se o primeiro valor não vazio entre as colunas
razao_social
,razao_social_2
enome_fantasia
na planilhav_clientes
. - A coluna CPF CNPJ é preenchida a partir da coluna
cpf_cnpj
da planilhav_clientes
. - A coluna PROFISSÃO é preenchida a partir da coluna
profissao
da planilhav_clientes
, e na sequência é mapeada por um dicionário de categorias de profissões. - As colunas CELULAR, TELEFONE e EMAIL são preenchidas semelhantemente à coluna NOME.
- A coluna PAIS é preenchida a partir de um mapeamento da coluna NACIONALIDADE.
- A coluna SEXO é preenchida a partir de um mapeamento da coluna NACIONALIDADE.
- A coluna ANOTAÇÕES GERAIS traz em cada linha uma informação relevante sobre diferentes campos presentes na planilha original
v_clientes
.
- A coluna NOME DO CLIENTE é preenchida a partir da coluna
cod_cliente
da planilhav_processos
, mapeada a partir da colunacodigo
da planilhav_clientes
. - A coluna TIPO DE AÇÃO é preenchida a partir do arquivo
v_objeto_acao
. - A coluna GRUPO DE AÇÃO é preenchida a partir do arquivo
v_area_atuacao
. - A coluna FASE PROCESSUAL é preenchida a partir do arquivo
v_fase
. - A coluna ETAPA é preenchida a partir da coluna FASE PROCESSUAL.
- As colunas NÚMERO DO PROCESSO e PROTOCOLO são preenchidas simultaneamente através de um processo de validação da quantidade de dígitos do número de cada processo.
- A coluna VARA é preenchida a partir do arquivo
v_local_tramite
. - A coluna COMARCA é preenchida a partir do arquivo
v_comarca
.
-
Validação das colunas da planilha CLIENTES e ajustes finais. -
Geração da planilha PROCESSOS. -
Validação das colunas da planilha PROCESSOS e ajustes finais. - Criação da interface usando Streamlit.
- Criação de um log para monitoramento do processo de criação, garantindo observabilidade para o processo.
- Criação de testes para as etapas, garantindo uma pipeline segura.
- 2024-12-12
- Validação da coluna NÚMERO DO PROCESSO e transferência de valores que não se encaixam na coluna PROTOCOLO
- Arquivo final renomeado para CLIENTES - 92577 e PROCESSOS - 92577, correspondente ao número da empresa
- Ajuste do preenchimento da coluna ANOTAÇÕES GERAIS da planilha CLIENTES
- Início do tratamento da planilha PROCESSOS. Colunas preenchidas:
- NOME DO CLIENTE
- TIPO DE AÇÃO
- GRUPO DE AÇÃO
- FASE PROCESSUAL
- NÚMERO DO PROCESSO (Falta validação)
- VARA
- COMARCA
- EXPECTATIVA/VALOR
- VALOR HONORÁRIOS
- PASTA
- DATA CADASTRO
- DATA FECHAMENTO
- DATA TRANSITO
- DATA ARQUIVAMENTO
- DATA REQUERIMENTO
- RESPONSÁVEL
- ANOTAÇÕES GERAIS (parcialmente)
- 2024-12-11
- Finalização da coluna CLIENTES, incluindo tratamento dos dados das colunas:
- NOME
- CPF CNPJ
- PROFISSÃO
- CEP
- PIS PASEP
- NACIONALIDADE
- PAIS
- SEXO
- DATA DE NASCIMENTO
- ANOTAÇÕES GERAIS
- Finalização da coluna CLIENTES, incluindo tratamento dos dados das colunas:
- 2024-12-03
- Atualização do README, início da validação das colunas de CLIENTES.
- Criação do arquivo
data_wrangling
para limpeza e transformação das colunas dos dataframes.
- 2024-12-02
- Base do projeto pronta.
- Capaz de gerar uma planilha de CLIENTES porém sem validação.