Home

Jump to bottom Edit New page

宅教授 edited this page Feb 14, 2019 · 29 revisions

Welcome to the easy12306 wiki!

整体的设计思路

借用百度提供的光学字符识别功能，来教我的文字识别器——卷积神经网络。
让文字识别器来教我的图片分类器——统计学专家，看，这张验证码中有打字机哦，这张里也有...
让图片分类器反过来教我的文字识别器，看，这张噪声满满的文字图表示的一定就是这以下八种图片中的某一种。
让统计学专家来教我的卷积神经网络识别图片，从而可以面对前所未见的图片。

A教B来，B教A，AB二者很愉快…

中文识别在测试集上的效果

texts

它把路灯当成漏斗了…

偷偷的问：标题中我说是测试集，实际上，我说错了，对吧。

如何？

~$ python3 main.py 2.jpg
41      # 要找的东西是41
0 0 41  # 第一行第一列就是41
0 1 39
0 2 73  # 上一节有提到，73就是蒸笼
0 3 73
1 0 33
1 1 41
1 2 31  # 最后的这两个是同一种东西
1 3 31

具体的编号：https://gist.github.com/zhaipro/97d46ff244f66d17961a5f1ef17b6d8f

识别前所未见的图片

~$ python3 mlearn_for_image.py 8.jpg
[0.8991613]  # 可信度
[0]          # 0 表示的就是打字机

尚未认证的思路

关于文字识别的一些思路如下：

先识别第一个名词，从而知道其长度，从而得出第二个词的所在位置，…
在训练集中增加一种新的"名词图"：空白无字。
还是说，直接定义空白好呢。
更新学习手段，让其能直接识别有噪音的文字图。
让文字识别器一次运行就能识别多标签。
让识别器一次运行就能得出完整的答案。

其余的兴趣

Keras官方博客中提到的REST API