OCR Recognition

Prototipo de uso del motor OCR (Optical Character Recognition) Tesseract.

Ubuntu

Instalar el motor Tesseract OCR en el sistema:

sudo apt install tesseract-ocr

Crear un directorio donde alojar los archivos para idiomas:

mkdir /usr/local/share/tessdata

Bajar el contenido de los archivos de idioma:

wget -P /usr/local/share/tessdata/ https://github.com/tesseract-ocr/tessdata/blob/master/eng.traineddata
wget -O spa.traineddata -P /usr/local/share/tessdata/ https://github.com/tesseract-ocr/tessdata/blob/master/spa_old.traineddata

Este proyecto Maven utiliza la dependencia a Tess4j

Se puede probar con los archivos de imágenes de prueba (en castellano) alojados con el código fuente bajo:

images/

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
images		images
src		src
.gitignore		.gitignore
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR Recognition

Ubuntu

About

Releases

Packages

Languages

fjspitz/recognition

Folders and files

Latest commit

History

Repository files navigation

OCR Recognition

Ubuntu

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages