Skip to content

Commit

Permalink
adding images for segmonto
Browse files Browse the repository at this point in the history
  • Loading branch information
alix-tz committed Feb 7, 2024
1 parent ed427d2 commit c462431
Show file tree
Hide file tree
Showing 3 changed files with 23 additions and 3 deletions.
26 changes: 23 additions & 3 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -56,12 +56,33 @@ Une petite partie de ce corpus correspond également aux enregistrements des jug

![illus_upper](static/img/illus_signatures.png)

- les signatures sont systématiquement transcrites par un `¥`. Tous les segments contenant des signatures et des paraphes (en général ils ne contiennent rien d'autre) ont été associés au type "Signature".
- les signatures sont systématiquement transcrites par un `¥`. Tous les segments contenant des signatures et des paraphes (en général ils ne contiennent rien d'autre) ont été associés au type "DefaultLine:Signature".


![illus_upper](static/img/illus_printed.png)

- les portions de texte pré-imprimées, notamment les en-têtes des tableaux et les préambules ont été transcrits. Les segments concernés ont été associés au type "printed".
- les portions de texte pré-imprimées, notamment les en-têtes des tableaux et les préambules ont été transcrits. Les segments concernés ont été associés au type "DefaultLine:Print".

## SegmOnto

L'ontologie SegmOnto a été appliquée de manière simplifée:

- `MainZone` est utilisé pour le texte libre en en-tête de la page.
- `NumberingZone` signale la zone de pagination manuscrite (souvent tracée au crayon)
- `TableZone` signale la zone principale, présentée sous la forme d'un tableau. En revanche, le détail des en-têtes et colonne n'est pas annoté.
- `MarginTextZone` est parfois utilisé pour les annotations en marge des tableaux.

![illus_segmonto_zones](static/img/segmonto_zones.png)

Pour les lignes de texte, comme indiqué ci-dessus, trois types de lignes sont recensés:

- `DefaultLine:Handwritten` pour les inscriptions manuscrites
- `DefaultLine:Signature` pour les paraphes et les signatures, ce qui permet de les ignorer si besoin.
- `DefaultLine:Print` pour les en-têtes du tableau et les lignes imprimées, ce qui permet de les ignorer si besoin.

![illus_segmonto_lines](static/img/segmonto_lines.png)



## Les autres dépôts LECTAUREP

Expand All @@ -82,4 +103,3 @@ Une petite partie de ce corpus correspond également aux enregistrements des jug
| ![inria](static/img/logo_inria.png) | ![archives nationales](static/img/logo_archives-nationales.png) |



Binary file added static/img/segmonto_lines.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added static/img/segmonto_zones.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit c462431

Please sign in to comment.