OCR
模型
一般都是DB(ResNet50_vd) + CRNN(Resnet34_vd、MobileNetV3)
项目名称 | 优点 | 缺点 |
1.cnocr | 安装使用方便,对环境的要求不高,检测精准度和识别准确率较高——cnocr 默认是ch_PP-OCRv3_det,这个是飞桨 ocr,用 cnocr 启动方便一些 | 语言方面有局限性,仅能识别中文简体繁体、英文、数字等,如需识别更高专业度的公式或其他语言需要进行自己的训练。 |
2.easyocr | 安装调用方便,支持识别监测多种语言,识别的精确度尚可 | 对中文检测的准确度一般,对排版规整的印刷体都有较好的表现,但对于稍有畸变或包含其他字体的图像其效果一般;识别的速度较慢,模型较大,EasyOCR的内存占用较高。 |
3.mmocr | 功能完善,包括文本检测、文本识别、以及端到端的文本识别任务都有给出对应的方法以及详细的说明文档 | 基于openmmlab的环境安装配置较为繁琐,不适合快速上手 |
4.paddleocr | 方便进行自己的训练:官方给到的训练集非常全,也有常用的合成、标注工具。基本满足个性化训练的场景应用,不需要再自己花时间找,一键下载就行,文档中也有详细的说明;识别准确率较高、速度快 | 基于paddle框架,并不是目前所使用的主流框架,对未使用过的小白或是需要进行后续开发可能不是很友好,项目整体比较复杂,学习成本较高 |
5.tesseract | tesseract具有良好的可扩展性,用户可以使用自定义训练数据来训练和优化OCR模型,Tesseract还提供了API和接口,方便用户进行二次开发和集成 | 不是专门针对中文场景且相关文档主要是英文,经过测试感觉其对于复杂字形和字体的识别准确性较低,与其他OCR相比,Tesseract的准确率可能相对较低 |
ㅤ | ㅤ | ㅤ |
Loading...