更新

2021.12.21 《OCR十讲》课程开讲，12月21日起每晚八点半线上授课！【免费】报名地址：https://aistudio.baidu.com/aistudio/course/introduce/25207
2021.12.21 发布PaddleOCR v2.4。OCR算法新增1种文本检测算法（PSENet），3种文本识别算法（NRTR、SEED、SAR）；文档结构化算法新增1种关键信息提取算法（SDMGR），3种DocVQA算法（LayoutLM、LayoutLMv2，LayoutXLM）。
2021.9.7 发布PaddleOCR v2.3，发布PP-OCRv2，CPU推理速度相比于PP-OCR server提升220%；效果相比于PP-OCR mobile 提升7%。
2021.8.3 发布PaddleOCR v2.2，新增文档结构分析PP-Structure工具包，支持版面分析与表格识别（含Excel导出）。
2021.6.29 FAQ新增5个高频问题，总数248个，每周一都会更新，欢迎大家持续关注。
2021.4.8 release 2.1版本，新增AAAI 2021论文端到端识别算法PGNet开源，多语言模型支持种类增加到80+。
2020.12.15 更新数据合成工具Style-Text，可以批量合成大量与目标场景类似的图像，在多个场景验证，效果明显提升。
2020.12.07 FAQ新增5个高频问题，总数124个，并且计划以后每周一都会更新，欢迎大家持续关注。
2020.11.25 更新半自动标注工具PPOCRLabel，辅助开发者高效完成标注任务，输出格式与PP-OCR训练任务完美衔接。
2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型，整体模型3.5M(详见PP-OCR Pipeline)，适合在移动端部署使用。
2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型，媲美商业效果。
2020.9.17 更新英文识别模型和多语种识别模型，已支持德语、法语、日语、韩语，更多语种识别模型将持续更新。
2020.8.26 更新OCR相关的84个常见问题及解答，具体参考FAQ
2020.8.24 支持通过whl包安装使用PaddleOCR，具体参考Paddleocr Package使用说明
2020.8.21 更新8月18日B站直播课回放和PPT，课节2，易学易用的OCR工具大礼包，获取地址
2020.8.16 开源文本检测算法SAST和文本识别算法SRN
2020.7.23 发布7月21日B站直播课回放和PPT，课节1，PaddleOCR开源大礼包全面解读，获取地址
2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO，支持iOS和Android系统
2020.7.15 完善预测部署，添加基于C++预测引擎推理、服务化部署和端侧部署方案，以及超轻量级中文OCR模型预测耗时Benchmark
2020.7.15 整理OCR相关数据集、常用数据标注以及合成工具
2020.7.9 添加支持空格的识别模型，识别效果，预测及训练方式请参考快速开始和文本识别训练相关文档
2020.7.9 添加数据增强、学习率衰减策略,具体参考配置文件
2020.6.8 添加数据集，并保持持续更新
2020.6.5 支持 attetnion 模型导出 inference_model
2020.6.5 支持单独预测识别时，输出结果得分
2020.5.30 提供超轻量级中文OCR在线体验
2020.5.30 模型预测、训练支持Windows系统
2020.5.30 开源通用中文OCR模型
2020.5.14 发布PaddleOCR公开课
2020.5.14 发布PaddleOCR实战练习
2020.5.14 开源8.6M超轻量级中文OCR模型

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

update.md

update.md

更新

Files

update.md

Latest commit

History

update.md

File metadata and controls

更新