Déployez un modèle dans le cloud

Vous êtes Data Scientist dans une très jeune start-up de l'AgriTech, nommée "Fruits!", qui cherche à proposer des solutions innovantes pour la récolte des fruits. La volonté de l’entreprise est de préserver la biodiversité des fruits en permettant des traitements spécifiques pour chaque espèce de fruits en développant des robots cueilleurs intelligents.

Les données

Votre collègue Paul vous indique l’existence d’un document, formalisé par un alternant qui vient de quitter l’entreprise. Il a testé une première approche dans un environnement Big Data AWS EMR, à partir d’un jeu de données constitué des images de fruits et des labels associés (en téléchargement direct à ce lien). Le notebook réalisé par l’alternant servira de point de départ pour construire une partie de la chaîne de traitement des données.

Notre mission

Vous êtes donc chargé de vous approprier les travaux réalisés par l’alternant et de compléter la chaîne de traitement. Il n’est pas nécessaire d’entraîner un modèle pour le moment. L’important est de mettre en place les premières briques de traitement qui serviront lorsqu’il faudra passer à l’échelle en termes de volume de données !

Notre travail dans ce dossier

Un notebook sur le cloud contenant les scripts en Pyspark exécutables (le preprocessing et une étape de réduction de dimension de type PCA). Les images du jeu de données initial ainsi que la sortie de la réduction de dimension (une matrice écrite sur un fichier CSV ou autre) disponible dans un espace de stockage sur le cloud. Un support de présentation

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
Brodin_Camille_1_notebook_012024.ipynb		Brodin_Camille_1_notebook_012024.ipynb
Brodin_Camille_3_presentation_012024.pdf		Brodin_Camille_3_presentation_012024.pdf
README.md		README.md
df_results_cloud.csv		df_results_cloud.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Déployez un modèle dans le cloud

Les données

Notre mission

Notre travail dans ce dossier

About

Releases

Packages

Languages

kmille50/OPC_Projet8_CB

Folders and files

Latest commit

History

Repository files navigation

Déployez un modèle dans le cloud

Les données

Notre mission

Notre travail dans ce dossier

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages