- 👋 Olá, eu sou @BrunoRammon
- 👀 Eu tenho interesse em Ciência de dados e Machine Learning
- 🌱 Atualmente, estou em transição de carreira para Ciência/Análise de dados
Manipulação |
|
Modelagem |
|
Interpretacao de variáveis |
|
Orquestração |
|
Deployment |
|
Visualização |
|
Análise Estatística |
|
Neste projeto, foi feito um sistema de machine learning (com códigos para treinamento e inferência) para prever o churn de vendedores da olist, isto é, o modelo provê um score referente a probabilidade de vendedor deixar de vender nos próximos 6 meses. Assim, entre outras finalidades, esse score pode ser usado para:
- promover ações de incentivo aos vendedores da plataforma de forma mais direcionada
- educar os vendedores da plataforma para que eles possam tomar ações para melhorar a chance de conversão de vendas na plataforma
Stack utilizadas: pandas, sklearn, kedro, lightgbm, xgboost, catboost, feature-engine, mlflow, Docker
Cloud: Amazon S3
Hard-skills: machine learning, modelos de propensão, monitoramento de sistemas de ML
Neste projeto, foi realizado a limpeza e tratamento (Outliers e dados faltantes) da base de dados relacionada ao mercado de dados no brasil. Além disso, foi feita a construção de dashboard para verificação de hipóteses levantadas sobre os dados. Em parceria com @jorgeluizfigueira.
Bibliotecas utilizadas: Pandas, Streamlit, Seaborn, Matplotlib, Plotly
Neste projeto, foi realizado a obtenção de dados de músicas, albuns e artistas a partir da API do Spotify. Posteriomente, tais dados foram salvos em um banco de dados criado com o SGBD PostgreSQL através de uma conexão com o banco utilizando a biblioteca Psycopg2 do Python.
Bibliotecas utilizadas: Pandas, Streamlit, PostgreSQL, Psycopg2, SpotifyAPI, JSON
Neste projeto, foi realizado a limpeza e tratamento (Outliers e dados faltantes) da base de dados de alugueis de imóveis. Além disso, foi feita análises univariada e bivariada dos dados visando extrair insights a partir base. Em parceria com @jorgeluizfigueira.
Bibliotecas utilizadas: Pandas, Statistics, Numpy
Análise de algoritmos de aprendizado supervisionado em um problema de classificação de raças de cães e gatos
Neste projeto, foi realizado a análise de algoritmos de aprendizado supervisionado em um problema de classificação de raças de cães e gatos. Os algoritmos testados foram: KNN, árvore de decisão, Naive Bayes, Rede Neural. Além disso, foram testados alguns comitês de classificação: Bagging, Ada Boost, Random Forest e Stacking. Realizado em parceria com Kelmo.
Principais bibliotecas utilizadas: pandas, sklearn, skimage, scikit_posthocs, scipy, plotly
Hard-skills: classificação de imagens, treinamento e validação de algoritmos de ML, técnicas de amostragem, testes estatísticos (Friedman e Posthoc-Nemenyi)
Neste projeto, foi desenvolvido um jogo da forca em python como parte dos requisitos do módulo de Lógica de programação do curso de Python e Dados (Let's Code by Ada).
Bibliotecas utilizadas: Streamlit
Neste projetos foi desenvolvido um dashboard para mostrar a comparação da letalidade da Covid-19 entre países.
Bibliotecas utilizadas: Pandas, matplotlib, jupyter notebook
Um sistema para cálculo de parcelas de financiamento SAC ou Price.
Bibliotecas utilizadas: Pandas, Streamlit, matplotlib