Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

您好,模型在英文数据集上表现可以,但是也有问题 #8

Open
tnkong opened this issue May 8, 2019 · 4 comments
Open

Comments

@tnkong
Copy link

tnkong commented May 8, 2019

No description provided.

@tnkong
Copy link
Author

tnkong commented May 8, 2019

模型在识别较短的文本行的时候loss的数量级在0.05左右,很准确,但是在识别较长的英文文本(20个字符以上)的时候,loss在0.6左右,有的时候甚至到了1.n,且预测结果相对不准确,有错误字符,我的训练数据都是水平的一行文本图片,论文上说对regular的文本图片表现也不错,但是我在英文数据集上得到了相对理想的结果,但是我在中文数据集(字符6000多,较多繁体字)上,loss在8左右震荡,始终不能降低,请问有什么模型调整的建议

@tnkong
Copy link
Author

tnkong commented May 8, 2019

训练数据集是用这个程序生成的,https://github.com/Belval/TextRecognitionDataGenerator;
如果您觉得不合适请建议一个更好的模拟数据的生成程序,此外,原程序的处理方法会把图片resize成(100,100)
对于字符数量较小的图片,resieze后产生的字符像素点的扭曲,相对较小,如果是20个字符以上的图片(高度大约20几像素,长度超过100像素),resize后会产生较多的扭曲,我直觉上认为直接resize成(100, 100)可能是不合适的,如果有什么好的修改能尽量减少像素信息的改变请提出,我会进全力去尝试

@tnkong
Copy link
Author

tnkong commented May 8, 2019

图片的预处理过程如何修改, CNN曾要如何修改? 我觉得模型应该很厉害,可是中文上不行

@TyrionChou
Copy link

问一下,您跑这个模型的tensorflow环境是多少?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants