Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Supprimer les adresses des BAL #228

Open
Olyon opened this issue Feb 2, 2021 · 3 comments
Open

Supprimer les adresses des BAL #228

Olyon opened this issue Feb 2, 2021 · 3 comments

Comments

@Olyon
Copy link

Olyon commented Feb 2, 2021

Les bases adresses locales sont incorporées et sont même les adresses prioritaires de la BAN https://adresse.data.gouv.fr/bases-locales. Donc si toutes les adresses des BAL viennent de https://adresse.data.gouv.fr/data/adresses-locales alors elles sont toutes présentes dans https://adresse.data.gouv.fr/data/ban/adresses-odbl donc aller chercher les 2 est inutile.
(Si l'on veux avoir la source de l'adresse, il faudrait regarder la colonne source_position de la BAN, (cadastre, commune…) mais pas sur que ça soit utile.)

Les adresses se trouve en double dans BANO et donc on a une différence entre le nombre d'adresses par exemple pour Saint-Christophe-sur-Dolaison entre https://bano.openstreetmap.fr/fantoir/index.html#insee=43174 et https://bano.openstreetmap.fr/fantoir/top_adresses_manquantes.html#dept=43 où l'on en a le double car pas de recherche avec source=BAN pour les top_adresses_manquantes contrairement au pages de communes.
En Savoie et Haute Savoie, le problème est différent,
la BAL fournie des noms en majuscule non accentué avec le type de voie abrégé, et j’ai l’impression que la BAN supprime les majuscules et on a donc les voies en double avec 2 orthographes sur la page https://bano.openstreetmap.fr/fantoir/top_adresses_manquantes.html#dept=74

L’autre solution est de modifier la requête sql pour n’aller chercher que ce qui a source=BAN ce qui semble être le cas pour les pages des communes.

J’ai regarder les export de la BAN, les adresses ne semble pas en double (je n’ai pas regarder comment sont fait les export) par contre pour les adresses venant de la BAN (hors BAL) la source indiqué est CAD, je pense qu’il faudrait modifié cela ou modifier le lisez moi qui dit :
CAD = donnée directement issue du cadastre, C+O = donnée du cadastre enrichie par OSM (nom de voie par exemple)
pour faire apparaître que la source n’ai pas exclusivement le cadastre.

@vdct
Copy link
Member

vdct commented Feb 4, 2021

Les bases adresses locales sont incorporées et sont même les adresses prioritaires de la BAN https://adresse.data.gouv.fr/bases-locales. Donc si toutes les adresses des BAL viennent de https://adresse.data.gouv.fr/data/adresses-locales alors elles sont toutes présentes dans https://adresse.data.gouv.fr/data/ban/adresses-odbl donc aller chercher les 2 est inutile.

Au moment d'ajouter la BAN comme source j'ai fait pas mal de comptages et j'arrivais à la conclusion que la BAN ne couvrait pas tout le périmètre des BAL, c'est pourquoi j'ai gardé les BALs jusque là. Il faudrait refaire un test de recouvrement pour voir si c'est toujours vrai. Dans le doute en attendant je préfère les garder.

Les adresses se trouve en double dans BANO et donc on a une différence entre le nombre d'adresses par exemple pour Saint-Christophe-sur-Dolaison entre https://bano.openstreetmap.fr/fantoir/index.html#insee=43174 et https://bano.openstreetmap.fr/fantoir/top_adresses_manquantes.html#dept=43 où l'on en a le double car pas de recherche avec source=BAN pour les top_adresses_manquantes contrairement au pages de communes.
En Savoie et Haute Savoie, le problème est différent,
la BAL fournie des noms en majuscule non accentué avec le type de voie abrégé, et j’ai l’impression que la BAN supprime les majuscules et on a donc les voies en double avec 2 orthographes sur la page https://bano.openstreetmap.fr/fantoir/top_adresses_manquantes.html#dept=74

L’autre solution est de modifier la requête sql pour n’aller chercher que ce qui a source=BAN ce qui semble être le cas pour les pages des communes.

Oui il faut retravailler le SQL pour corriger les 2 soucis. J'ai créé une issue pour ça côté osm-vs-fantoir. Merci pour ton analyse

J’ai regarder les export de la BAN, les adresses ne semble pas en double (je n’ai pas regarder comment sont fait les export) par contre pour les adresses venant de la BAN (hors BAL) la source indiqué est CAD, je pense qu’il faudrait modifié cela ou modifier le lisez moi qui dit :
CAD = donnée directement issue du cadastre, C+O = donnée du cadastre enrichie par OSM (nom de voie par exemple)
pour faire apparaître que la source n’ai pas exclusivement le cadastre.

Oui, je penche pour plutôt modifier le lisez-moi, je n'ai pas voulu changer les valeurs de source brutalement, ne maîtrisant pas comment elles sont utilisées par les consommateurs des données.

@Marc-marc-marc
Copy link

qu'en est-il du timing ? = si une commune publie une BAL, combien de temps faut-il à son intégration dans la BAN ?
si l'opération n'est pas atomique, cela explique que BAN ne contient pas toutes les BAL et que donc prioritiser BAL devant BAN a du sens.

@Olyon
Copy link
Author

Olyon commented Feb 23, 2021

J'ai l'impression qu'il peut y avoir des adresses en double (ou plus) dans les BAL mais pas dans la BAN, ce qui peux faire qu'au passage BAL vers BAN ont est une diffèrence du nombre d'adresses.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants