修复LaTeXOCR 在paddleX中的一些问题 #13646

liuhongen1234567 · 2024-08-13T12:07:06Z

修改了 LaTeX OCR 中的backbone和head的部分代码，使其可以在推理开启 config.enable_new_ir(True) 可以正常运行
修改了export_model.py，使其可以将 LaTeX OCR 中词表json文件也写入到yml文件中
将评估、推理和导出的特殊参数配置写入到py文件中，避免用户手动设置一些不必要的参数
修改了 /workspace/code/paddle_ocr/github_pr/2024_8_13/latexocr_paddle/ppocr/utils/formula_utils/math_txt2pkl.py 文件，对用户裁剪的随机尺寸图像进行可容错。避免用户随机裁剪数据集后，图像尺寸过于随意，导致数据集每组图片过少，训练时间变长
将LaTeX OCR 中的特殊安装包写入到单独的requirement，以兼容后续其他公式模型所需的其他安装包

liuhongen1234567 · 2024-08-14T02:01:08Z

@GreatV 麻烦review 一下代码

ppocr/modeling/backbones/rec_resnetv2.py

GreatV

LGTM

liuhongen1234567 added 2 commits August 13, 2024 11:58

repair_some_Bug_for_paddlex

7a62f48

style2

304d93b

liuhongen1234567 force-pushed the latexocr_paddlex branch from bc93493 to 304d93b Compare August 13, 2024 12:55

style2

544d8c1

GreatV reviewed Aug 14, 2024

View reviewed changes

ppocr/modeling/backbones/rec_resnetv2.py Show resolved Hide resolved

add_epilson_for groupnorm

469abfa

GreatV approved these changes Aug 14, 2024

View reviewed changes

GreatV merged commit 5f0b90a into PaddlePaddle:main Aug 14, 2024
3 of 4 checks passed

paddle-bot bot added the contributor label Nov 13, 2024

Provide feedback