Statisticien/Data scientist passionné avec une solide formation en mathématiques appliquées et IA/machine learning.
La plupart des projets d'IA sont réalisés en utilisant PyTorch et des low-level APIs.
Projet | Technologies | Description |
---|---|---|
Segmentation d'IRM du cerveau | Python, PyTorch, U-Net, CV2 | - Segmentation sémantique pour localiser les tumeurs. - 80%+ de score Dice/IoU sur les patients de test. |
Segmentation d'images de football | Python, PyTorch, U-Net, CV2 | - Segmentation pour détecter les joueurs/arbitres. - Création d'un réseau U-Net, 85% d'IoU. |
Classification chien chat avec bruit | Python, PyTorch, CV2, filtre de Wiener, ConvNeXtV2 | - Traitement d'images avec flou et bruit sel poivre. - Transfer learning sur ConvNeXtv2, 92,7% d'accuracy. |
Détection de port du masque | Python, PyTorch, YOLOv8, Faster R-CNN | - Transfer learning sur YOLOv8 et Faster R-CNN. - Comparaison des résultats des modèles. |
Détection de tumeurs du cerveau | Python, PyTorch, ResNet50, ConvNeXt, Scikit-learn | - Visualisation et analyse de scans IRM. - Classification multiple. |
Détection du cancer du sein | Python, PyTorch, ResNet50, ConvNeXt, EfficientNet, Scikit-learn | - Visualisation et analyse d'images de mammographie. - Transfer learning sur des CNN, 71% d'accuracy. |
Génération d'images de saules | Python, PyTorch, Pandas, ML | - Création et gestion d’une BDD d’images de saules. - Développement et utilisation d’un GAN pour générer des images de saules. |
Projet | Technologies | Description |
---|---|---|
Analyse de sentiments | Python, PyTorch, Torchtext, LSTM | - Entrainement d'un modèle LSTM bidirectionnel à plusieurs couches. - Traitement des données par batch, 87,3% d'accuracy sur IMDB. |
Projet | Technologies | Description |
---|---|---|
Risque financier pour l'approbation de prêt | Python, Scikit-learn, Pandas, ML | - EDA (données financières), tests et fiting de lois statistiques. - Scoring, régression pour la prédiction de score, classification pour l'attribution de label (métriques : score f1/precision). |
Prédiction des maladies cardiaques pour une meilleure prévention | Python, Scikit-learn, Pandas, ML | - EDA (données de diabète) et pre-processing. - Optimisation de modèles de machine learning (MLP, RDF, XGB, SVC) pour avoir les meilleurs résultats (métriques : score f1/recall). |
Prédire si un individu est positif au COVID-19 | Python, Scikit-learn, Pandas, ML | - EDA (données tests sanguins), feature engineering. - Création de pipelines et optimisation de modèles de machine learning (MLP, RDF, XGB, SVC). |
Détection de logiciels malveillants | Python, Scikit-learn, Pandas, ML | - Nettoyage, visualisation, analyse et étude statistique des données. - Évaluation des modèles avec des métriques de performance (AUC, précision). Identification des variables influentes. |
Projet | Technologies | Description |
---|---|---|
Estimation par bootstrap et déchiffrage d'un message codé | R, Python | - Application de deux approches bootstrap (non paramétrique et paramétrique), calcul des IC/IP bootstrap. - Comparaison des méthodes bootstrap selon la taille d’échantillon, basée sur la précision des IC et la représentation graphique des IP. - Déchiffrage d'un message caché avec un algorithme MCMC. |
Étude de la criminalité aux États-Unis | R | - Analyse de la criminalité en fonction de variables socio-économiques. - Sélection et comparaison de modèles de régression multiple (R², AIC). Tests d’hypothèses sur les coefficients et sur la significativité des modèles. |
Analyse biostatistique des données d'expression génique avec tests multiples | R | - Recherche et théorie sur les tests multiples. - Tests multiples avec corrections sur des données réelles d'expression génique. |
Projet | Technologies | Description |
---|---|---|
Application de réservation de salles | Java, MySQL | - Gestion automatique afin d'éviter les conflits de réservation. - Connexion Java - base de données SQL. |
Équation de la chaleur en 2D | C++ | - Modélisation numérique par différences finies. - Résolution du problème de diffusion thermique en 2D dans un four et optimisation des calculs. |
Résolution de systèmes linéaires en C++ | C++ | - Résolution de systèmes par factorisation LU. - Méthode de la puissance / puissance inverse. |
Projet | Technologies | Description |
---|---|---|
Planification industrielle et optimisation de la supply chain 2 | AMPL | - Modélisation mathématique d'un problème de gestion et résolution. - Analyse post-optimisation. |
Planification industrielle et optimisation de la supply chain 1 | AMPL | - Modélisation mathématique d'un problème de gestion et résolution. - Analyse post-optimisation. |
😄