- Ce repository correspond à l'une des séances de TP 3BIM bases de données.
- Les slides du TP sont disponibles à cette adresse: https://abel-betraoui.github.io/tp-insa-anonymity-slides/.
Ce TP a pour objectifs de sensibiliser les étudiants aux notions de data privacy tout en étant un prétexte pour manipuler des bases de données.
Pour installer les dépendances nécessaires au TP:
- Créer un virtualenv (ou autre solution pour isoler votre environnement de développement)
- Le code fourni fonctionne sur python3 (testé sur python3.8)
cd tp-insa-anonymity/
pip install .[notebook]
La documentation du package anonymity est disponible ici.
- Que sont les données personnelles & les données sensibles ?
- Pourquoi s'y intéresser ?
- Qu'est ce que la pseudonymisation et quelles sont les limites de cette approche ?
- Qu'est ce que l'anonymisation ?
- Présentation de critères pour décrire l'anonymisation d'un jeu de données (K-anonymité / L-diversité)
- Comment anonymiser des jeux de données ?
- Introduction à la confidentialité différentielle.
Un notebook de solution se trouve à cette adresse: notebooks/solution.ipynb.