Skip to content
宅教授 edited this page Jan 19, 2019 · 29 revisions

Welcome to the easy12306 wiki!

  1. 中文识别
  2. 图片识别

整体的设计思路

  1. 借用百度提供的光学字符识别功能,来教我的文字识别器——卷积神经网络。
  2. 让文字识别器来教我的图片分类器——统计学专家,看,这张验证码中有打字机哦,这张里也有...
  3. 让图片分类器反过来教我的文字识别器,看,这张噪声满满的文字图表示的一定就是这以下八种图片中的某一种。

A教B来,B教A,AB二者很愉快…

中文识别在测试集上的效果

texts

它把路灯当成漏斗了…

如何?

2

~$ python3 main.py 2.jpg
41      # 要找的东西是41
0 0 41  # 第一行第一列就是41
0 1 39
0 2 73  # 上一节有提到,73就是蒸笼
0 3 73
1 0 33
1 1 41
1 2 31  # 最后的这两个是同一种东西
1 3 31

尚未认证的思路

关于文字识别的一些思路如下:

  1. 先识别第一个名词,从而知道其长度,从而得出第二个词的所在位置,…
  2. 在训练集中增加一种新的"名词图":空白无字。
  3. 还是说,直接定义空白好呢。

关于图片识别:

  1. 进一步的优化统计学数据。
  2. 试着根据统计学的结论来进一步的训练深度学习网络,从而面对可能会出现的前所未见的图片。

其余的兴趣

  1. Keras官方博客中提到的REST API
Clone this wiki locally