不能更简单的基于keras的CRNN汉字识别代码
感谢 https://github.com/qjadud1994/CRNN-Keras 的代码,在此基础上基于汉字识别做了一些修改,并极大地删减了代码的冗余功能。显然,功能的全面性势必也受到了影响,但是我们都知道,在程序开发的过程中,最难的是开始,而非全面。
源于一次汉字识别的比赛,因此面向的是对竖着写的汉字的识别 如果是横着写,则可注释掉代码中的转置操作 (注释中会说到)
推荐keras版本: 2.2.4
(pip install keras==2.2.4)
不指定版本的话会下载最新的keras版本, 会有一些问题。
一切均基于最简便原则, clone之后, 直接运行main_train.py即可直接开始训练, 运行main_pred.py则直接使用训练的模型进行测试(识别)。 为了保证可以使用,库中提供了机器少量的训练集和验证集图片,但足以运行此代码。 自己开发使用则需要对应的放入自己的图片。 需要注意的是由于文字识别需要字典,也就是所有标签的字的总和,这里需要使用者自己提供(我并不知道你的标签是啥)。这里给出了dictionary.txt作为字典,使用者只需仿照这个给出自己的字典即可。 Label也可以仿照label.txt即可。
为方便大家训练,这里给了我之前参加一项比赛时的数据集,也附上了标签。 链接:https://pan.baidu.com/s/1SAsT-fNox7WRVa-Axcrisw 提取码:u2rw
一切问题欢迎联系 lint17@fudan.edu.cn