Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

HTTP接口图像旋转校正后,返回的坐标不对了! #655

Open
1 task done
peng-poso2o opened this issue Sep 9, 2024 · 5 comments
Open
1 task done

HTTP接口图像旋转校正后,返回的坐标不对了! #655

peng-poso2o opened this issue Sep 9, 2024 · 5 comments

Comments

@peng-poso2o
Copy link

Issues

  • I have browsed through the Issues. 我已浏览过Issues,确定没有重复的建议。

Expected behavior 预期的功能

HTTP接口图像旋转校正后,返回的坐标不对了!

Approximate reference (optional) 近似的参考(可选)

No response

@hiroi-sora
Copy link
Owner

旋转校正(cls)是引擎层面的参数,只要引擎内部不出错,Umi-OCR的任务管线是不会修改坐标的。

你看看同一张图,用软件界面识别,及用http接口识别,坐标是否有明显不同?

如果只是偏移几个像素,那是正常的误差。

@hiroi-sora
Copy link
Owner

我这边没有复现问题,不管旋转到哪个方向,结果都是正常的。

你的测试原图可以上传上来看看吗

image

@peng-poso2o
Copy link
Author

对我来说最大的问题是文字相隔太近会自动合并!不知道这个间距能不能设置!

@hiroi-sora
Copy link
Owner

hiroi-sora commented Sep 10, 2024

1. 图像旋转问题

经过测试,发现这张图像的旋转参数有些异常。用部分程序打开,比如windows图像浏览器、PS、OpenCV库,图像是正朝上的。但用另一些接口打开,比如Pillow、QT,图像是逆时针90°的,如下。

如果只有这张图片有此问题,我推测可能是文件元数据出现损坏。如果一批图片有相同的问题,可能是相机设备向元数据中添加了私有格式信息,导致第三方程序读取异常。你可以用格式工厂等应用,将它们批量转成 jpg 格式,即舍弃原始元数据,就可以正常识别了。

image

2. 文字相隔太近会自动合并!不知道这个间距能不能设置!

不能设置,这是由文本检测模型的模型参数决定的,无法人工调整,只能重新训练/微调模型。

@peng-poso2o
Copy link
Author

OK

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants