Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

边缘过窄的图片,识别结果不准确 #7

Closed
ksom11 opened this issue Jul 28, 2022 · 3 comments
Closed

边缘过窄的图片,识别结果不准确 #7

ksom11 opened this issue Jul 28, 2022 · 3 comments

Comments

@ksom11
Copy link

ksom11 commented Jul 28, 2022

屏幕截图 2022-07-28 133123

@hiroi-sora
Copy link
Owner

hiroi-sora commented Jul 28, 2022

(Update:此问题已在 v1.2.6 解决。)

v1.2.5 的原回复:

您例图的上下边缘太窄,这会阻碍OCR文本检测算法的解析。这是本项目采用的识别库PaddleOCR中 文本检测(det)目前的一个缺陷,它需要一定的额外空间来确定文字范围框。

只要加大图片的高度,就能让识别准确率恢复正常:

👇原图识别结果:由于没有选择(CWS)方式
窄.png

👇增加高度之后:由于没有选择俯仰或倾斜方式,飞行方式指示器显示A/P处于驾驶盘操纵(CWS)方式。
宽.png

因此,这个问题的临时解决方法:

  1. 截取上下边缘更多的素材图片用于识别。据我测试,只要上下边缘 >= 一个字符的高度,就不会影响识别准确度。

可能的程序优化方式:(我暂时没计划实现这些优化)

  1. 针对性地训练文本检测det模型用于该场景。
  2. 在OCR前预处理,为高度过窄的图片自动添加空白边缘。

关于其他家API:

  • 我测试了腾讯OCR在线接口,似乎没有这个问题。你有大量需求的话,也许可以寻找使用 腾讯在线api(收费) 的同类项目。

@ksom11
Copy link
Author

ksom11 commented Jul 29, 2022

感谢答复

@hiroi-sora hiroi-sora changed the title 识别结果不准确 边缘过窄的图片,识别结果不准确 Aug 8, 2022
@hiroi-sora
Copy link
Owner

新版本 v1.2.6 已经彻底解决这个问题了。随着识别引擎的更新,窄边图片不会降低准确度

image29d8fcdbb38e8b73.png

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants