Dans un projet de data analyse, la data storytelling est un élément important du machine learning grâce auquel les entreprises peuvent comprendre le contexte de diverses opérations. Avec l'aide de la visualisation, les entreprises peuvent profiter de l'avantage de comprendre les données complexes et obtenir des informations qui les aideront à prendre des décisions. A travers ces lignes de codes vous apprendrez à mettre en œuvre le ggplot2 sur le jeu de données Uber Pickups et, à la fin, vous maîtriserez l'art de la visualisation des données en R. J’espère que ce projet vous plaira.
Les bibliothèques importantes que nous utiliserons sont :
ggplot2: C'est l'épine dorsale de ce projet. ggplot2 est la bibliothèque de visualisation de données la plus populaire et la plus utilisée pour créer des graphiques de visualisation esthétiques.
ggthemes: C'est un complément à notre bibliothèque principale ggplot2. Avec ceci, nous pouvons mieux créer des thèmes et des échelles supplémentaires avec le paquet ggplot2 principal.
lubridate: Notre ensemble de données comprend plusieurs périodes de temps. Afin de comprendre nos données dans des catégories temporelles distinctes, nous utiliserons le package lubridate.
dplyr : C'est une extension facilitant le traitement et la manipulation de données contenues dans une ou plusieurs tables. Elle propose une syntaxe claire et cohérente, sous formes de verbes, pour la plupart des opérations de ce type. Voici une simple analogie. Si les données constituent un tissu, nous pouvons voir dplyr comme à la fois la paire de ciseaux pour en faire la coupe, et l’aiguille et le fil pour le coudre.
tidyr: Ce package nous aidera à mettre de l'ordre dans nos données. Le principe de base de tidyr est de mettre en ordre les colonnes où chaque variable est présente dans une colonne, chaque observation est représentée par une ligne et chaque valeur représente une cellule.
DT: C'est une interface de la bibliothèque JavaScript DataTables. Il rend accessible les fonctionnalités de la librairie originale en R. La principale fonction de DT est datatable. Cette fonction permet de construire rapidement et efficacement un tableau interactif en format HTML à partir d’un data frame ou d’une matrice.
Scales : Avec l'aide des échelles graphiques, nous pouvons automatiquement faire correspondre les données aux bonnes échelles avec des axes et des légendes bien placés.