Scripts de traitement des csv fourni par les universités à destination des batch Karuta.
La spécification des traitements est décrite dans specifications_script_traitement_csv
./workIn.pl WORKING_DIR
où WORKING_DIR est le répertoire de travail.
WORKING_DIR doit contenir le fichier karuta.properties de paramétrage du script. Tout fichier, téléchargé ou calculé, serra placé dans ce répertoire.
-
log.file: Fichier de log (défaut : WORKING_DIR/karuta.log).
-
ftp.addr: Adresse du serveur sftp pour récupérer les fichiers.zip à traiter. De la forme login@server.name.
-
annee.scolaire: année scolaire sur 4 chiffres
-
univ.list: liste des universités à traiter; noms courts en minuscules. Désignés ci-dessous par nomUniv.
-
nomUniv.ftp.rep: nom du repertoire dans ftp de l'université nomUniv
-
nomUniv.file.prefix: prefix des fichiers de l'université nomUniv
si on ne veut pas récupérer un nouveau .zip mais travailler sur un déjà reçu et dézipé
- nomUniv.test.newPath: nom du répertoire déziper en entrée.
le fichier karuta.data contient les derniers fichiers traiter pour chaques univ: utile pour faire le calcul des différences.
- nomUniv.test.oldPath: nom de l'ancien répertoire sur lequel on va se basé pour calculer les différences sans tenir compte du karuta.data
Pour chaque université on récupère du sftp le dernier fichier non déjà présent dans WORKING_DIR. Pour chaque fichier récupéré un fichier.zip est créé dans WORKING_DIR prefixé par nomUniv et terminant par la date. Il contient les fichiers reçu et les fichiers créés (dans le répertoire nomUniv_diff).
A la racine de l'archive il y a aussi création d'un fichier de log contenant les lignes en entrées rejetées (non conforme).
- le repertoire des données reçu tel quelles : nomUniv_date
- le repertoire avec les fichiers calculés : nomUniv_date_diff