-
Beta Was this translation helpful? Give feedback.
Replies: 5 comments 3 replies
-
这个暂时没有参数控制,需要自己后处理一下 |
Beta Was this translation helpful? Give feedback.
-
好的,非常感谢, |
Beta Was this translation helpful? Give feedback.
-
你好,那这种问题,是不是也可以用你在issue,提过的就是处理页眉页脚的方法通过layout模块去识别一下pdf的版面行吗,或者说是在依托的RapidOCR上加参数,这种行不行 |
Beta Was this translation helpful? Give feedback.
-
试了。那个raplayout只能识别图片。如果我把PDF文件转为图片,可以识别,但是通过rapidocr识别这个转换为图片的pdf.错误率很大。可能要等你有时间把这个版面还原实现后就没问题了。不得不说大佬你这个识别扫描版的pdf是真的厉害。没有错误,但是转为图片后通过rapidocr识别就有错误。 |
Beta Was this translation helpful? Give feedback.
RapidOCRPDF这个库是两种思路实现的。有些PDF可以直接抽取其中文本,所以100%识别准确。如果不能直接抽取的,会有OCR,则会有错误。