diff --git a/README.md b/README.md index 8eb1460..7f2b39d 100644 --- a/README.md +++ b/README.md @@ -5,8 +5,8 @@ [![CircleCI](https://circleci.com/gh/OCR-D/assets.svg?style=svg)](https://circleci.com/gh/OCR-D/assets) * [SBB0000F29300010000](./data/SBB0000F29300010000/): Pages 1-5 of [http://resolver.staatsbibliothek-berlin.de/SBB0000F29300010000](http://resolver.staatsbibliothek-berlin.de/SBB0000F29300010000) -* [kant_aufklaerung_1784](./data/kant_aufklaerung_1784): [http://ocr-d.de/sites/all/GTDaten/kant_aufklaerung_1784.zip](http://ocr-d.de/sites/all/GTDaten/kant_aufklaerung_1784.zip), with TIFF compressed with JPEG + METS for second page -* [kant_aufklaerung_1784-binarized](./data/kant_aufklaerung_1784-binarized): [http://ocr-d.de/sites/all/GTDaten/kant_aufklaerung_1784.zip](http://ocr-d.de/sites/all/GTDaten/kant_aufklaerung_1784.zip), with binarized/gray produced by ocropus-nlbin + METS for all +* [kant_aufklaerung_1784](./data/kant_aufklaerung_1784): [https://www.deutschestextarchiv.de/book/show/kant_aufklaerung_1784](https://www.deutschestextarchiv.de/book/show/kant_aufklaerung_1784), with TIFF compressed with JPEG + METS for second page +* [kant_aufklaerung_1784-binarized](./data/kant_aufklaerung_1784-binarized): [https://www.deutschestextarchiv.de/book/show/kant_aufklaerung_1784](https://www.deutschestextarchiv.de/book/show/kant_aufklaerung_1784), with binarized/gray produced by ocropus-nlbin + METS for all * [kant_aufklaerung_1784-complex](./data/kant_aufklaerung_1784-complex): Result of running https://github.com/bertsky/workflow-configuration/blob/master/crop-anyocr-binarize-page-olena-sauvola-denoise-ocropy-deskew-page-ocropy-segment-tesseract-ocropy-dewarp-ocr-ocropy-tesseract.mk on kant_aufklaerung_1784 * [kant_aufklaerung_1784-page-block-line-word_glyph](./data/kant_aufklaerung_1784-page-block-line-word_glyph): Sample Page file with region, word and glyphs. * [test.ocrd.zip](./data/test.ocrd.zip): OCRD-ZIP of `kant_aufklaerung_1784`.