-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
decp.json to XML eats 4GB+ RAM. Too much for CircleCI free edition. #42
Comments
J'ai lancé le job Circle CI en local en utilisant CircleCI CLI, et le job s'est exécuté sans soucis. cc @strainel J'ai publié le résultat sur le dataset. |
L'erreur rapportée est renvoyée si le fichier passé au script scripts/jsonDECP2xmlDECP.sh n'existe pas. Donc ce que semble indiquer le log, c'est qu'au moment d'exécuter ce script, le fichier |
C'est cette commande qui échoue : https://github.com/139bercy/decp-rama/blob/master/process.sh#L85 Mais bizarrement, la précédente, qui utilise aussi |
Le script précédent celui qui échoue, scripts/get_new_data.sh, ne contient il me semble aucune commande susceptible de supprimer |
J'ai configuré un cron sur mon serveur personnel pour effectuer le traitement quotidien. |
merci @ColinMaudry ; du coup quelle est la cause racine du dysfonctionnement ? |
@strainel C'est encore un mystère : ça marche en local, mais pas en ligne. Pour l'instant, le principal suspect est notre dépassement du crédit Circle, mais c'était la même chose chez Etalab, sans que ce soit un problème. |
Prochaines étapes (en parallèle):
|
j'ai demandé à nos collègues des marchés ; pour le moment circle ci c'est pas dans l'offre... |
J'ai exécuté le workflow CircleCI avec accès SSH, j'ai pu observer des choses intéressantes :
|
C'est effectivement le problème : lorsque j'exécute ce script en local, le script python Solutions possibles :
|
J'imagine assez bien la solution numéro un : plutôt que de convertir les 135 Mo de JSON d'un bloc, le script pourrait boucler individuellement sur chacun des 135 000 marché et les convertir en XML. Je teste. |
splitter automatiquement en bloc de 30 000 marchés puis reconcaténer ? |
Conversion JSON > XML par blocs pour réduire la consommation de mémoire (#42)
Build réussi pour la branche Le script qui change tout : c257bcb |
Fixed |
Depuis la release de 1.14.0 et l'allongement du temps de traitement sans log à 4h, CircleCI rapporte l'erreur suivante :
The text was updated successfully, but these errors were encountered: