Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Problème Bano format json #301

Closed
mk1990-med opened this issue Oct 28, 2022 · 5 comments
Closed

Problème Bano format json #301

mk1990-med opened this issue Oct 28, 2022 · 5 comments

Comments

@mk1990-med
Copy link

Bonjour, j'utilise les fichiers Bano format json pour constituer un référentiel d'adresses utilisé par mon application. Dernièrement, j'ai eu un bug dans mon code lorsque je traite le fichier bano-76.json : ValueError: Unexpected character found when decoding object value.

En regardant le fichier, j'ai identifié ce record (voir champ name avec les doubles cotes) :

{"id":"76192b1bbb","citycode":"76192","type":"street","name":""Ecovillage ""Les Rainettes"""","postcode":"76910","lat":"50.025993","lon":"1.309035","city":"Criel-sur-Mer","departement":"Seine-Maritime","region":"Normandie","importance":0.2177,"housenumbers":{"1":{"lat":50.024862,"lon":1.308866},"10":{"lat":50.026109,"lon":1.309193},"11":{"lat":50.026182,"lon":1.309247},"12":{"lat":50.026306,"lon":1.30921},"13":{"lat":50.0263,"lon":1.308861},"14":{"lat":50.0265,"lon":1.308828},"15":{"lat":50.02666,"lon":1.308911},"16":{"lat":50.026651,"lon":1.309205},"17":{"lat":50.026512,"lon":1.309379},"2":{"lat":50.025044,"lon":1.308864},"3":{"lat":50.025325,"lon":1.308904},"4":{"lat":50.025538,"lon":1.30884},"5":{"lat":50.025449,"lon":1.309104},"6":{"lat":50.02568,"lon":1.309085},"7":{"lat":50.025881,"lon":1.309071},"8":{"lat":50.026005,"lon":1.308951},"9":{"lat":50.026122,"lon":1.308911}}}

vdct added a commit that referenced this issue Nov 1, 2022
* Update Fantoir T2 2022
* Ajout dans le dico type_voie (#285)
* typo sur le nom de fichier des communes pour batch nocturne
* Caractères parasites dans les noms BAN (#301)
@vdct
Copy link
Member

vdct commented Nov 1, 2022

Merci pour le signalement. C'est normalement corrigé depuis ce soir dans le code, et dans les données JSON demain

@mk1990-med
Copy link
Author

J'ai identifié le même problème sur le fichier bano-972.json:

{"id":"97232A050D","citycode":"97232","type":"place","name":"Lotissement "la Porte du Grand Sud"","postcode":"97280","lat":"14.542126","lon":"-60.838562","city":"Le Vauclin","departement":"Martinique","region":"Martinique","importance":0.05}
{"id":"97232A058M","citycode":"97232","type":"place","name":"Lotissement "sigy"","postcode":"97280","lat":"14.541938","lon":"-60.840248","city":"Le Vauclin","departement":"Martinique","region":"Martinique","importance":0.05}
{"id":"97232A059N","citycode":"97232","type":"place","name":"Résidence " Sigy "","postcode":"97280","lat":"14.540637","lon":"-60.841240","city":"Le Vauclin","departement":"Martinique","region":"Martinique","importance":0.05}

vdct added a commit that referenced this issue Nov 10, 2022
* Caractères parasites dans les noms du Cadastre (#301)
@vdct
Copy link
Member

vdct commented Nov 10, 2022

Merci pour le signalement. C'est normalement corrigé depuis ce soir dans le code, et dans les données JSON demain. Le problème venait cette fois-ci non de la source BAN, mais des lieux-dits du Cadastre

@mk1990-med
Copy link
Author

je pense qu'il faut propager la correction partout. J'ai le même problème sur le fichier bano-68.json.gz :
{"id":"68013B023D","citycode":"68013","type":"place","name":"Auf"s Kaibengaessle","postcode":"68220","lat":"47.571164","lon":"7.459281","city":"Attenschwiller","departement":"Haut-Rhin","region":"Grand Est","importance":0.05}

J'ai aussi un problème de format sur les fichiers suivants (je n'ai pas vérifié la cause)

  • bano-22.json.gz
  • bano-29.json.gz
  • bano-66.json.gz
  • bano-93.json.gz

vdct added a commit that referenced this issue Nov 21, 2022
* Rebase (#300)

* Update load_fantoir.sh

Update Fantoir T2 2022

* Ajout dans le dico type_voie (#285)

* typo sur le nom de fichier des communes pour batch nocturne

Co-authored-by: deuzeffe <36087963+deuzeffe@users.noreply.github.com>

* Caractères parasites dans les noms BAN (#301)

* Caractères parasites dans les noms du Cadastre (#301)

* Caractères parasites dans les noms OSM (#301)

Co-authored-by: deuzeffe <36087963+deuzeffe@users.noreply.github.com>
@vdct
Copy link
Member

vdct commented Nov 21, 2022

En effet il en restait, cette fois dans la source OSM.
BAN, Cadastre et OSM, le trio des sources est maintenant géré pour la suppression systématique des double-quote, incompatibles avec le JSON. C'est effectif dès demain dans les fichiers téléchargeables

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants