GitHub

Perseo: Spanish Optical Character Recognition (OCR)

Perseo is a vision transformer based OCR for the Spanish language.

The architecture is based on TrOCR. It is trained on the Spanish Wikipedia dataset, using trdg to generate the images of the sentences. The model's encoder is initialized with the small version of the encoder described in the TrOCR paper, while the decoder in initialized with the RoBERTa Spanish model available in Hugging Face.

Status

Version 0.0 is trained using machine typed characters to evaluate its performance. In future versions handwritten characters will be used.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
utils		utils
.gitignore		.gitignore
README.md		README.md
dataset.py		dataset.py
eval.ipynb		eval.ipynb
trainer.py		trainer.py
training.py		training.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Perseo: Spanish Optical Character Recognition (OCR)

Status

About

Releases

Packages

Languages

pablomainar/perseo

Folders and files

Latest commit

History

Repository files navigation

Perseo: Spanish Optical Character Recognition (OCR)

Status

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages