Skip to content

Latest commit

 

History

History
51 lines (38 loc) · 2.4 KB

README.md

File metadata and controls

51 lines (38 loc) · 2.4 KB

EDA2018

L'examen à l'école HETIC 1er semestre, le cours de data science

Datascience

Vous êtes datascientist chez Kickstarter, une plate-forme de crowdfunding. Vous souhaitez prédire la réussite ou non d'un projet . Avant de créer votre classifieur, vous entreprenez de faire une analyse préparatoire des données (EDA) pour avoir une meilleure intuition sur ces dernières.

Vous avez accès à toutes les ressources que vous souhaitez (cheatsheet, internet, etc.). N'hésitez pas à en faire bon usage.

Pensez à bien organiser votre notebook, à annoter vos graphiques et à les commenter judicieusement. Parmis les critères de notation :

  • savoir charger un dataset,
  • analyse des valeurs manquantes et dupliquées,
  • analyse des outliers,
  • analyse univariée,
  • analyse multivariée,
  • ainsi que toute analyse qui vous semble judicieuse pour prédire le succès d’un projet Kickstarter.

Rendu

Vous rendrez votre Jupyter Notebook via Github. Pour cela créez un nouveau dépôt (repository) nommé EDA2018 et uploadez le notebook seul sur ce dépôt. Ensuite, envoyez le lien dans un mail aux adresses suivantes :

  • alain.demenet@gmail.com
  • florent.pietot@gmail.com

Ajoutez en pièce jointe votre notebook zippé (afin d'avoir une double sauvegarde de votre travail et pour éviter tout problème éventuel).

Description du dataset

Le dataset dataset.csv est un instantané du site en janvier 2018 :

Colonne Description
ID internal kickstarter id
name name of project - a project is a finite work with a clear goal that you’d like to bring to life. Think albums, books, or films
category category
main_category category of campaign
currency currency used to support
deadline deadline for crowdfunding
goal fundraising goal - the funding goal is the amount of money that a creator needs to complete their project
launched date launched
pledged pledged amount in the project currency
state current condition the project is in
backers number of backers
country country pledged from
usd pledged amount of money pledged in USD (conversion made by Kickstarter)
usd_pledged_real amount of money pledged in USD (conversion made by fixer.io api)
usd_goal_real goal amount in USD (conversion made by fixer.io api)

Bon courage !