【论文简介】PP-OCRv1-v4中文字符识别论文概述_ppocrv4-CSDN博客:https://blog.csdn.net/imwaters/article/details/132192317

【论文简介】PP-OCRv1-v4中文字符识别论文概述_ppocrv4-CSDN博客(https://blog.csdn.net/imwaters/article/details/132192317)

中文模型尺寸仅为3.5M，能识别6622个汉字。识别63个字母数字符号的模型，仅为2.8M

一、PP-OCRv1 模型结构
图中的模型大小是关于中英文识别的。对于字母数字符号识别( alphanumeric symbols recognition)，文本识别的模型大小为1.6M~0.9M。其余的模型的大小相同
主要流程为： DB文字检测 + 方向分类+CRNN字符识别
其中文本检测算法选用可微二值化算法 DB，使用 97K图片训练
文本识别算法选用CRNN，使用1700万张图片的图片训练，PPOCRv3采用的是 SVTR
文本方向分类器 MobileNetv3, 在检测和识别模块之间添加，以应对不同方向的文本识别。(60万+图片训练)
下图黑色的文字表示改进结构或者策略