You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
La localisation est spécifiée dans un élément dédié pour chaque échelon administratif (très pratique), même si les valeurs peuvent être mal standardisées.
Le schéma diffère fortement sur ce point des DT. Je proposerais de réviser ce modèle. Par exemple :
<articleold-id="PO7-02698"pg="649">
<vedette><i>Pont-du-Doux</i></vedette>
<localisationde>Ardèche</localisationde>
<localisationca>c<sup>on</sup> de Tournon</localisationca>
<localisationco>c<sup>ne</sup> de Saint-Barthélemy-le-Plein</localisationco>
…
</article>
deviendrait (à revoir, pas top, cf segmentation de la commune – il faut analyser l’ensemble des balises).
<articleold-id="PO7-02698"pg="649">
<vedette><i>Pont-du-Doux</i></vedette>
<definition>
<localisation>
<departement>Ardèche</departement>
<canton>canton de Tournon</canton>
<communeprecision="approximatif"insee="07217">commune de Saint-Barthélemy-le-Plein</commune>
<!-- 'Saint-Barthélémy-le-Plain' dans le COG 2011 -->
</localisation>
</definition>
…
</article>
localisationpa
Unique pays de localisation, si PAS la France : Allemagne, Asie mineure, Italie, Palestine, Suisse
Un seul article avec localisationpa ET localisationde :
PO7-01969 : pa = 'Suisse' / de = 'Haut-Rhin'.
210 articles sans localisationpa NI localisationde (//article[not(localisationde)][not(localisationpa)]) :
doyenneté
affluents
?
localisationde
(Ancien) Département de localisation.
2 articles avec 2 départements de localisation :
PO7-02695: Isère + Savoie
PO8-02447: Bouches-du-Rhône + Var
Liste étendue des valeurs possibles… Il va falloir normaliser les valeurs dans le code utile au liage :
Ain
Allier
Alpes Maritimes
Alpes-Maritimes
Ardèche
Aude
Aveyron
Bas-Rhin
Basses-Alpes
Basses-Pyrénées
Bouches-du-Rhône
Bouches-du-Rhône et Var
Cantal
Charente
Charente-Maritime
Cher
Corrèze
Côte-d’Or
Creuse
Dordogne
Doubs
Drôme
Gard
Gers
Gironde
Haut-Rhin
Haute-Alpes
Haute-Garonne
Haute-Loire
Haute-Marne
Haute-Saône
Haute-Savoie
Haute-Vienne
Hautes-Alpes
Hérault
Indre
Indre-et-Loire
Isère
Jura
Loir-et-Cher
Loire
Loiret
Lot
Lot-et-Garonne
Lozère
Maine-et-Loire
Marne
Meurthe-et-Moselle
Nièvre
Puy-de-Dôme
Rhône
Saône-et-Loire
Savoie
Seine
Somme
Tarn
Tarn-et-Garonne
Var
Vaucluse
Vienne
Vosges
Yonne
territoire de Belfort
localisationco
Canton de localisation.
Analyser intérêt.
localisationco
Commune de localisation.
3 articles avec plusieurs communes de localisation :
PO7-02635: Arnavon + Saint-Ferréol
PO7-02932: Saint-Saphorin + Chardonne
PO9-04206: Viala-du-Tarn + Saint-Rome-de-Tarn
localisation
Localisation indéfinie.
Par exemple :
PO8-00098: <localisation>arr<sup>t</sup> de Grasse</localisation>
TODO: analyser
Formes anciennes
Une forme (fa) + sa ou ses référence(s) (reference).
fa
Contient la forme ancienne.
Italique
621 i hors vedette, par exemple :
PO7-00180: <forme_ancienne><fa>Assinetz</fa>, <reference>304 var. <i>b</i></reference>.</forme_ancienne>
PO7-01190: <compl>, localité disparue près de <i>Beauchastel</i></compl>
Analyse des fichiers XML des Pouillés
Décomptes et synthèse
article
vedette
vedette/i
//i[not(ancestor::vedette)]
localisationpa
localisationde
localisationca
localisationco
localisation
forme_ancienne
fa
reference
i
sup
//sup[not(ancestor::localisationca)][not(ancestor::localisationco)]
sm
renvoi
compl
x
y
z
Pagination
Par commodité, ajout de la pagination de chaque article dans
article/@pg
.Vedettes
Les balises
i
rendent difficile l’extraction des vedettes :PO7-00004
:<vedette><i>Abbaye</i> (<i>l’</i>)</vedette>
PO7-03995
:<vedette><i>Vauffelin</i>, en all. <i>Füglisthal</i></vedette>
PO7-00053
:<vedette><i>Alby</i> ou <i>Alby-sur-Chéran</i></vedette>
PO7-02803
:<vedette><i>Réchésy</i>, en all. <i>Röschlach</i> ou <i>Röschli</i></vedette>
Pire :
PO7-00461
:<vedette><i>Bonhomme</i> (<i>le</i>), en all. <i>Diedolshausen</i></vedette>
PO7-00662
:<vedette><i>Chaffal</i> (<i>le</i>), auj. <i>l’Escoulin</i></vedette>
Des exemples dans DT02 :
DT02-00003
:<vedette><sm>Abbaye (L’),</sm></vedette>
DT02-00014
:<vedette><sm>Abonval</sm> ou <sm>Ploisy,</sm></vedette>
DT02-00944
:<vedette><sm>Buisson (Le)</sm> ou <sm>Montabaudière,</sm></vedette>
Je propose de standardiser en suivant le modèle précédemment adopté :
PO7-00004
:<vedette><sm>Abbaye (l’)</sm></vedette>
PO7-03995
:<vedette><sm>Vauffelin</sm>, en all. <sm>Füglisthal</sm></vedette>
PO7-00053
:<vedette><sm>Alby</sm> ou <sm>Alby-sur-Chéran</sm></vedette>
PO7-02803
:<vedette><sm>Réchésy</sm>, en all. <sm>Röschlach</sm> ou <sm>Röschli</sm></vedette>
PO7-00461
:<vedette><sm>Bonhomme (le)</sm>, en all. <sm>Diedolshausen</sm></vedette>
PO7-00662
:<vedette><sm>Chaffal (le)</sm>, auj. <sm>Escoulin (l’)</sm></vedette>
Qu’en dites-vous ? Pas si trivial… cf
PO7-00662
.Localisation
Schéma
La localisation est spécifiée dans un élément dédié pour chaque échelon administratif (très pratique), même si les valeurs peuvent être mal standardisées.
Le schéma diffère fortement sur ce point des DT. Je proposerais de réviser ce modèle. Par exemple :
deviendrait (à revoir, pas top, cf segmentation de la commune – il faut analyser l’ensemble des balises).
localisationpa
Unique pays de localisation, si PAS la France : Allemagne, Asie mineure, Italie, Palestine, Suisse
Un seul article avec
localisationpa
ETlocalisationde
:PO7-01969
: pa = 'Suisse' / de = 'Haut-Rhin'.210 articles sans
localisationpa
NIlocalisationde
(//article[not(localisationde)][not(localisationpa)]
) :localisationde
(Ancien) Département de localisation.
2 articles avec 2 départements de localisation :
PO7-02695
: Isère + SavoiePO8-02447
: Bouches-du-Rhône + VarListe étendue des valeurs possibles… Il va falloir normaliser les valeurs dans le code utile au liage :
localisationco
Canton de localisation.
Analyser intérêt.
localisationco
Commune de localisation.
3 articles avec plusieurs communes de localisation :
PO7-02635
: Arnavon + Saint-FerréolPO7-02932
: Saint-Saphorin + ChardonnePO9-04206
: Viala-du-Tarn + Saint-Rome-de-Tarnlocalisation
Localisation indéfinie.
Par exemple :
PO8-00098
:<localisation>arr<sup>t</sup> de Grasse</localisation>
TODO: analyser
Formes anciennes
Une forme (
fa
) + sa ou ses référence(s) (reference
).fa
Contient la forme ancienne.
Italique
621
i
hors vedette, par exemple :PO7-00180
:<forme_ancienne><fa>Assinetz</fa>, <reference>304 var. <i>b</i></reference>.</forme_ancienne>
PO7-01190
:<compl>, localité disparue près de <i>Beauchastel</i></compl>
PO7-02550
:<renvoi>Voir <i>Saint-Sylvestre</i>.</renvoi>
D’accord pour conserver.
Exposant
405
sup
horslocalisationca
etlocalisationco
. – souvent des abréviations.TODO: analyser
Renvois
Peut-on normaliser les renvois comme dans les DT et les insérer dans un commentaire ?
DT02-04296
:<renvoi>— Voy. <sm>Montreuil.</sm></renvoi>
<renvoi>Voir <i>Saint-Sylvestre</i>.</renvoi>
(PO7-02550
) deviendrait :Doutes et corrections ?
compl
?
x
Souvent de la ponctuation : incertitudes de saisie ?
y
Des quadratins ajoutés devant la première forme ancienne d’un article ? Supprimer ?
z
Dans
fa
: restitution d’une forme ancienne ?The text was updated successfully, but these errors were encountered: