OCR模型列表（V2.0，2021年1月20日更新）

说明

2.0版模型和1.1版模型的主要区别在于动态图训练vs.静态图训练，模型性能上无明显差距。

本文档提供的是PPOCR自研模型列表，更多基于公开数据集的算法介绍与预训练模型可以参考：算法概览文档。

一、文本检测模型
二、文本识别模型
三、文本方向分类模型
四、Paddle-Lite 模型

PaddleOCR提供的可下载模型包括推理模型、训练模型、预训练模型、slim模型，模型区别说明如下：

模型类型	模型格式	简介
推理模型	inference.pdmodel、inference.pdiparams	用于预测引擎推理，详情
训练模型、预训练模型	.pdparams、.pdopt、*.states	训练过程中保存的模型的参数、优化器状态和训练中间信息，多用于模型指标评估和恢复训练
slim模型	*.nb	经过飞桨模型压缩工具PaddleSlim压缩后的模型，适用于移动端/IoT端等端侧部署场景（需使用飞桨Paddle Lite部署）。

各个模型的关系如下面的示意图所示。

一、文本检测模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_det	slim裁剪版超轻量模型，支持中英文、多语种文本检测	ch_det_mv3_db_v2.0.yml	2.6M	推理模型
ch_ppocr_mobile_v2.0_det	原始超轻量模型，支持中英文、多语种文本检测	ch_det_mv3_db_v2.0.yml	3M	推理模型 / 训练模型
ch_ppocr_server_v2.0_det	通用模型，支持中英文、多语种文本检测，比超轻量模型更大，但效果更好	ch_det_res18_db_v2.0.yml	47M	推理模型 / 训练模型

二、文本识别模型

1. 中文识别模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_rec	slim裁剪量化版超轻量模型，支持中英文、数字识别	rec_chinese_lite_train_v2.0.yml	6M	推理模型 / 训练模型
ch_ppocr_mobile_v2.0_rec	原始超轻量模型，支持中英文、数字识别	rec_chinese_lite_train_v2.0.yml	5.2M	推理模型 / 训练模型 / 预训练模型
ch_ppocr_server_v2.0_rec	通用模型，支持中英文、数字识别	rec_chinese_common_train_v2.0.yml	94.8M	推理模型 / 训练模型 / 预训练模型

说明： 训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型，在真实应用场景中有着更好的表现，预训练模型则是直接基于全量真实数据与合成数据训练得到，更适合用于在自己的数据集上finetune。

2. 英文识别模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
en_number_mobile_slim_v2.0_rec	slim裁剪量化版超轻量模型，支持英文、数字识别	rec_en_number_lite_train.yml	2.7M	推理模型 / 训练模型
en_number_mobile_v2.0_rec	原始超轻量模型，支持英文、数字识别	rec_en_number_lite_train.yml	2.6M	推理模型 / 训练模型

3. 多语言识别模型（更多语言持续更新中...）

说明： 新增的多语言模型的配置文件通过代码方式生成，您可以通过--help参数查看当前PaddleOCR支持生成哪些多语言的配置文件：

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
python3 generate_multi_language_configs.py --help

下面以生成意大利语配置文件为例：

1. 生成意大利语配置文件测试现有模型

如果您仅仅想用配置文件测试PaddleOCR提供的多语言模型可以通过下面命令生成默认的配置文件，使用PaddleOCR提供的小语种字典进行预测。

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# 通过-l或者--language参数设置需要生成的语种的配置文件，该命令会将默认参数写入配置文件
python3 generate_multi_language_configs.py -l it

2. 生成意大利语配置文件训练自己的数据

如果您想训练自己的小语种模型，可以准备好训练集文件、验证集文件、字典文件和训练数据路径，这里假设准备的意大利语的训练集、验证集、字典和训练数据路径为：

训练集:{your/path/}PaddleOCR/train_data/train_list.txt
验证集:{your/path/}PaddleOCR/train_data/val_list.txt
使用PaddleOCR提供的默认字典：{your/path/}PaddleOCR/ppocr/utils/dict/it_dict.txt
训练数据路径:{your/path/}PaddleOCR/train_data

使用以下命令生成配置文件：

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# -l或者--language字段是必须的
# --train修改训练集，--val修改验证集，--data_dir修改数据集目录，-o修改对应默认参数
# --dict命令改变字典路径，示例使用默认字典路径则该参数可不填
python3 generate_multi_language_configs.py -l it \
--train train_data/train_list.txt \
--val train_data/val_list.txt \
--data_dir train_data \
-o Global.use_gpu=False

3. 多语言模型与配置文件

模型名称	字典文件	模型简介	配置文件	推理模型大小	下载地址
french_mobile_v2.0_rec	ppocr/utils/dict/french_dict.txt	法文识别	rec_french_lite_train.yml	2.65M	推理模型 / 训练模型
german_mobile_v2.0_rec	ppocr/utils/dict/german_dict.txt	德文识别	rec_german_lite_train.yml	2.65M	推理模型 / 训练模型
korean_mobile_v2.0_rec	ppocr/utils/dict/korean_dict.txt	韩文识别	rec_korean_lite_train.yml	3.9M	推理模型 / 训练模型
japan_mobile_v2.0_rec	ppocr/utils/dict/japan_dict.txt	日文识别	rec_japan_lite_train.yml	4.23M	推理模型 / 训练模型
chinese_cht_mobile_v2.0_rec	ppocr/utils/dict/chinese_cht_dict.txt	中文繁体识别	rec_chinese_cht_lite_train.yml	5.63M	推理模型 / 训练模型
te_mobile_v2.0_rec	ppocr/utils/dict/te_dict.txt	泰卢固文识别	rec_te_lite_train.yml	2.63M	推理模型 / 训练模型
ka_mobile_v2.0_rec	ppocr/utils/dict/ka_dict.txt	卡纳达文识别	rec_ka_lite_train.yml	2.63M	推理模型 / 训练模型
ta_mobile_v2.0_rec	ppocr/utils/dict/ta_dict.txt	泰米尔文识别	rec_ta_lite_train.yml	2.63M	推理模型 / 训练模型
latin_mobile_v2.0_rec	ppocr/utils/dict/latin_dict.txt	拉丁文识别	rec_latin_lite_train.yml	2.6M	推理模型 / 训练模型
arabic_mobile_v2.0_rec	ppocr/utils/dict/arabic_dict.txt	阿拉伯字母	rec_arabic_lite_train.yml	2.6M	推理模型 / 训练模型
cyrillic_mobile_v2.0_rec	ppocr/utils/dict/cyrillic_dict.txt	斯拉夫字母	rec_cyrillic_lite_train.yml	2.6M	推理模型 / 训练模型
devanagari_mobile_v2.0_rec	ppocr/utils/dict/devanagari_dict.txt	梵文字母	rec_devanagari_lite_train.yml	2.6M	推理模型 / 训练模型

更多支持语种请参考: 多语言模型

三、文本方向分类模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_cls	slim量化版模型	cls_mv3.yml	2.1M	推理模型 / 训练模型
ch_ppocr_mobile_v2.0_cls	原始模型	cls_mv3.yml	1.38M	推理模型 / 训练模型

四、Paddle-Lite 模型

模型版本	模型简介	模型大小	检测模型	文本方向分类模型	识别模型	Paddle-Lite版本
V2.0	超轻量中文OCR 移动端模型	7.8M	下载地址	下载地址	下载地址	v2.9
V2.0(slim)	超轻量中文OCR 移动端模型	3.3M	下载地址	下载地址	下载地址	v2.9

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

models_list.md

models_list.md

OCR模型列表（V2.0，2021年1月20日更新）

一、文本检测模型

二、文本识别模型

1. 中文识别模型

2. 英文识别模型

3. 多语言识别模型（更多语言持续更新中...）

1. 生成意大利语配置文件测试现有模型

2. 生成意大利语配置文件训练自己的数据

3. 多语言模型与配置文件

三、文本方向分类模型

四、Paddle-Lite 模型

Files

models_list.md

Latest commit

History

models_list.md

File metadata and controls

OCR模型列表（V2.0，2021年1月20日更新）

一、文本检测模型

二、文本识别模型

1. 中文识别模型

2. 英文识别模型

3. 多语言识别模型（更多语言持续更新中...）

1. 生成意大利语配置文件测试现有模型

2. 生成意大利语配置文件训练自己的数据

3. 多语言模型与配置文件

三、文本方向分类模型

四、Paddle-Lite 模型