Skip to content
This repository has been archived by the owner on Jul 20, 2022. It is now read-only.

Latest commit

 

History

History
37 lines (24 loc) · 1.13 KB

README.md

File metadata and controls

37 lines (24 loc) · 1.13 KB

trackdechets-etl

Scripts de transformation de données dans le cadre de Trackdéchets, orchestrés avec Airflow. Les premiers scripts serviront à préparer les données nécessaires à la production de fiches d'inspection pour les inspecteurs de l'environnement.

Configuration

Le projet utilise pipenv pour la gestion des dépendances.

  1. Installez les dépendances (apache-airflow est installé plus tard) :
pipenv install
  1. Faites une copie de sample.env.sh vers env.sh
  2. Ajustez les variables de env.sh à votre environnement
  3. Sourcez env.sh afin de déclarer les variables d'environnemnet (source env.sh)
  4. Installez et démarrez Airflow :
./start.sh
  1. Dans Airflow, activez le DAG icpeETL
  2. À droite, cliquez sur le bouton 'Lecture', puis 'Trigger DAG'

Le DAG est exécuté.

Notes de version

21/03/2022

  • ajout des données GEREP pour la siretisation des données ICPE
  • ajout de nouvelles rubriques aux rubriques Trackdéchets
  • amélioration des stats de siretisation
  • mise à jour d'Airflow (2.2.3 => 2.2.4)